スポンサーリンク

生存者バイアス(survivorship bias)

survivorship bias 産業・組織
survivorship bias

「生き残った成功例だけを見て、消えた失敗例を見落とすせいで、結論が”やたら楽観的”にズレる偏り」です。

簡単な説明

生存者バイアスって、「生き残って目立ってる人(モノ)だけ見て、消えていった大量の失敗を”なかったこと”にしちゃうバグ」です。

成功談がキラキラして見えるときほど、「見えてない脱落組、何人いる?」って一回ツッコむのがコツです。

由来

「survivor(生存者)」だけを観察してしまい、「non-survivor(脱落者・消滅したもの)」がデータから消えることで起きます。統計学的には選択バイアス(sampling/selection bias)の一種として説明されます。

有名な逸話として、第二次世界大戦中に帰還した爆撃機の被弾箇所だけを見て補強を決めそうになったところ、統計学者アブラハム・ワルドが「帰ってこなかった機体(=観測不能な脱落例)を考えるべき」と指摘した話がよく紹介されます。

【図解】戦闘機のエピソードを理解する

このエピソードは視覚的に理解すると本質が見えやすくなります。

帰還した機体の被弾パターン:

  • 翼や胴体に赤い点(被弾箇所)が集中
  • エンジンやコックピット周辺には被弾が少ない

間違った判断: 「赤い点が多い場所=弱点だから補強しよう」

正しい判断: 「赤い点がない場所こそ致命的な弱点」

なぜなら、エンジンやコックピットに被弾した機体は墜落して帰ってこれなかった(=観測不能)からです。帰還できたということは「そこに穴があっても致命傷ではなかった」証拠なのです。

具体的な説明

「今見えている”勝ち組”だけで『これが成功法則だ!』って決めると危ないです。見えていない”負け組”(途中でやめた人、消えた会社、閉鎖された商品)が大量にあるかもしれないのに、それを数えないまま結論を出すからです。」

スポンサーリンク

一般的な説明(短く整理)

原因:失敗例が記録に残りにくい/途中で消える(倒産、退学、サービス終了、データ欠損)

結果:成功率や効果が実際より高く見える/成功者の特徴を過大評価する

生存者バイアスは、母集団からの標本抽出が「生き残り」という条件で切断(truncation)されることで起きる選択バイアスです。

観測されない脱落が、成績・健康・能力などの変数と関連している(Missing Not At Random的)と、推定量が系統的に歪みます。

近縁の落とし穴として、観察研究で「受賞した人は長生き」などを出すときに、受賞前の期間を不適切に扱うと**immortal time bias(不死時間バイアス)**が発生し、効果が水増しされます。

【概念図】データの「切断(Truncation)」を理解する

生存者バイアスは、データが特定のライン(切断点)で切られることで起きます。

本来の姿:

  • 努力と成果には緩やかな相関がある(成功者も失敗者も含む全体像)
  • 多様な要因が複雑に絡み合っている

バイアス後の見え方:

  • 「成功した人」という一定のライン(切断点)より上のデータしか見えない
  • 相関が歪んだり、成功者の特異な共通点(例:朝4時に起きる)が「必須条件」のように過大評価される
  • 実際には「たまたま成功した人の中に朝型が多かっただけ」かもしれないのに、因果関係があるように錯覚する

具体的な実験・観察手法と結論(数字入り)

1) “オスカー受賞者は長生き?”(観察研究の例)

2001年の研究では、オスカー受賞者の平均寿命が79.7歳、比較対象が75.8歳で、3.9年長い(P=0.003)と報告されました。

しかし後の再解析では、受賞者は「受賞するまで生きている必要がある」ため、その期間が”死なない時間”として扱われる設計上の偏り(immortal time bias)が問題になり、有利さは大幅に小さくなる(おおむね約1年程度で有意でない方向)と指摘されています。

結論:生存者(受賞者)だけの見方や、時間の扱いを誤ると「受賞=長生き」という因果っぽい結論が盛られます。

2) 投資(投資信託)の”成績が良く見える”問題

投資信託は成績が悪いと償還・統合・閉鎖でデータから消えやすく、残ったファンドだけで平均を取ると成績が上振れします。

1996年の研究は、消えたファンドも追跡して生存者バイアスを推定するアプローチを示しています。

解説例として、生存者バイアスは年率で約0.9%程度の上振れになりうる、という推定も紹介されています(業界平均のリスク調整後リターン差として)。

結論:「今も残っている優秀ファンド」だけ見て「この運用会社はすごい」と言うと、消えた不成績ファンド分だけ”盛れる”可能性があります。

例文

「この塾は東大合格者が多いけど、途中で辞めた生徒を入れると評価が変わるかもしれない。これは生存者バイアスだよ。」

「SNSの成功談は目立つけど、投稿しても伸びなかった人は見えにくい。成功談だけで判断すると生存者バイアスになるよ。」

疑問

Q
生存者バイアスは、サンプルサイズを増やせば必ず解決しますか?
A

必ずではありません。サンプルが増えても「脱落したデータが体系的に欠けている」ままだと、偏りは残ります。重要なのは”誰が消えたか”の仕組みを把握することです。

Q
生存者バイアスと、単なる「成功者の話を聞く」の違いは何ですか?
A

体験談を聞くこと自体は問題ではありませんが、それを根拠に「成功率」や「因果」を推定するときに、失敗例が欠けると統計的に結論が歪みます。

Q
生存者バイアスと「不死時間バイアス」は同じですか?
A

近い仲間ですが同一ではありません。不死時間バイアスは特に観察研究で「将来の出来事(例:受賞、治療開始)まで生きた時間」を誤って有利に数えることで起きる時間設計の偏りです。

Q
有名な”戦闘機の被弾”の話は、何がポイントですか?
A

「帰ってきた機体の穴が多い場所=弱い場所」と思いがちですが、帰還できたということは”そこに穴があっても致命傷ではなかった”可能性がある点です。観測できない”帰ってこなかった機体”を想像して逆を考えるのが要点です。

Q
生存者バイアスを避ける実務的な方法は何ですか?
A

代表的には、①脱落者を追跡して含める、②脱落メカニズムをモデル化する、③生存分析や時間依存共変量など適切な手法を使う、④感度分析(最悪/最良ケース)で結論の頑健性を確認する、です。

理解度を確認する問題

問1 生存者バイアスの説明として最も適切なのはどれですか。

  • A. 変数間の相関が因果を意味すると誤解すること
  • B. 生き残った対象だけを観察して結論が偏ること
  • C. 測定誤差が大きいせいで検定力が下がること
  • D. ランダム化により交絡が増えること

正解:B

問2 「受賞者は長生き」という結果が、受賞前の期間の扱いで水増しされる偏りはどれですか。

  • A. 回帰効果
  • B. 不死時間バイアス
  • C. ホーソン効果
  • D. 期待効果

正解:B

問3 投資信託の成績研究で、生存者バイアスが起きやすい理由として最も適切なのはどれですか。

  • A. 手数料が一定ではないから
  • B. 成績が悪いファンドが閉鎖・統合でデータから消えるから
  • C. 株価がランダムウォークだから
  • D. 分散が時間で変化するから

正解:B

問4 生存者バイアスは統計学的に何の一種と位置づけられますか。

  • A. 選択バイアス(サンプリングバイアス)
  • B. 観察者期待バイアス
  • C. 実験者効果
  • D. 内的妥当性の脅威ではない

正解:A

問5 生存者バイアスを減らす工夫として不適切なのはどれですか。

  • A. 脱落した対象も追跡して含める
  • B. 時間依存の曝露を時間依存共変量として扱う
  • C. 脱落者を除外して分析を簡単にする
  • D. 感度分析で結論の頑健性を確認する

正解:C

上記の理解度テスト(選択式)

次の文章のうち、生存者バイアスが最も強く疑われるものを1つ選んでください。

  • A. 200人を無作為割付して新薬群と偽薬群を比較した
  • B. 途中脱落者の理由も記録して追跡し、解析に反映した
  • C. いま残っている人気YouTuber 30人だけ調べて「毎日投稿すれば必ず成功する」と結論した
  • D. 測定者を盲検化して評価した

関連キーワード

  • 選択バイアス(selection bias)
  • サンプリングバイアス(sampling bias)
  • 脱落(attrition)/欠測(missing data)
  • 切断(truncation)/検閲(censoring)
  • 不死時間バイアス(immortal time bias)
  • 生存分析(survival analysis)
  • 時間依存共変量(time-dependent covariate)

関連論文

1) Redelmeier & Singh (2001) ―「オスカー受賞者は長生き?」(Annals of Internal Medicine)

概要

  • 目的:アカデミー賞受賞による「社会的地位の上昇」が、長期死亡率(寿命)と関連するかを検討
  • デザイン:後ろ向きコホート。主演/助演の候補者762人を同定し、各人に対し「同じ映画に出演」「同性」「同時代生まれ」の共演者を887人マッチさせ、合計1649人を分析

結果(数値)

  • 追跡中央値:出生から66年、死亡772件
  • 受賞者の平均寿命:79.7歳 vs 比較対象:75.8歳+3.9年(P=0.003)
  • 死亡率の相対差:28%低下(95%CI 10%〜42%)
  • 追加受賞:死亡率22%低下(CI 5%〜35%)と関連。一方で「出演本数」「ノミネート数」は有意な低下と関連しない

解釈(生存者バイアスとどう関係?)

一見すると「受賞(高い地位)=長寿」に見えますが、観察研究なので「健康・生活習慣・社会経済的資源・仕事量」などの交絡や、後述の不死時間バイアスで”有利に見える”可能性があります。心理学検定的には、「因果(受賞が寿命を延ばす)」ではなく、まずは関連(association)として読むのが安全です。

2) Sylvestre, Huszti & Hanley (2006) ― 上記の再解析(Annals of Internal Medicine)

概要

  • 目的:2001年研究の推定に、受賞者に”ずるく有利”な扱いが入っていないかを点検し、より適切な方法で再解析
  • ポイント(どこが問題?):受賞者は「受賞するまで生きている必要」があります。受賞前の生存期間を、受賞後の解析に”加点”してしまうと、受賞者が不当に長生きに見えます。これがimmortal time bias(不死時間バイアス)

結果(数値)

バイアスを避ける方法で再解析すると、寿命差は**「約1年」**程度に近づき、統計的に有意ではないと結論

解釈(何を意味する?)

「生存者(受賞者)だけが観測されやすい」問題に加えて、**時間の扱い(いつから追跡開始とみなすか)**がズレると、効果が”盛れる”ことを示す代表例です。

心理学検定でよく問われる観点としては、

  • 観察研究の因果推論は設計と解析の前提に弱い
  • “受賞できた人”は受賞まで生存している=構造的に有利

という理解が重要です。

3) Brown, Goetzmann, Ibbotson & Ross (1992) ― “Survivorship Bias in Performance Studies”(RFS)

概要

  • 目的:「過去に成績が良いファンドは将来も良い」というパフォーマンス持続性が、本当に予測可能性(スキル)なのか、それとも生存者バイアスで見かけ上そう見えるのかを理論・数値例で示す
  • **主張の核:**生存者に限られた(途中で消えたファンドが落ちた)データでは、ボラティリティ(変動)とリターンの関係が歪み、それが「当たり続ける人がいる」ような錯覚=見かけの予測可能性を作る

結果(数値)

Oxfordの公開情報(要旨)では、**「数値例(numerical examples)で、この効果が先行研究の予測可能性を説明できるほど強い」**と述べています(要旨レベルのため、具体パラメータや推定値は本文参照)

解釈(心理学的にどう読む?)

「成功して残っているもの」だけを見ると、

  • “勝者は勝ち続ける”(ホットハンド)
  • “この戦略は再現性が高い”

のようなストーリーが作れますが、実際には脱落(消滅)データが欠けるだけで”規則性があるように見える”ことがある、という強い警告です。

心理学検定に寄せて言うなら、これは「代表性ヒューリスティック」や「確証バイアス」とも相性が悪く、データ生成過程(誰が残り、誰が消えるか)を先に疑うのが正解ルートです。

4) Elton, Gruber & Blake (1996) ― “Survivorship Bias and Mutual Fund Performance”(RFS)

概要

  • **目的:**投資信託研究で問題になる「消えたファンド(償還・統合など)」を追跡し、生存者バイアスの大きさを推定
  • **設計の特徴:**1976年末に存在したファンドを起点に追跡し、ファンドが他ファンドに合併した場合も合併条件を考慮してリターンを計算
  • **付加分析:**消える(合併される)ファンドと、受け皿(パートナー)ファンドの特徴比較も実施

結果(数値)

公開要旨だけだと「どれくらい上振れしたか」の具体値が見えにくいのですが、関連文脈として、同系統の研究(債券ファンド)では、**生存者バイアスが年あたり約27bp(0.27%)**程度という推定が引用されています。

※上の27bpは「債券ファンド」文脈の推定値として紹介されているもので、1996年RFS本論文の”主結果そのものの数値”ではなく、近い系譜の推定例として捉えてください。

解釈(何を意味する?)

「今も存在するファンド」だけで平均成績を出すと、成績が悪くて消えたファンドが抜けるため、運用業界の実力が実際より良く見える方向に歪みます。

心理学検定向けには、これは「選択バイアス」の典型例で、”データが存在する条件”そのものが結果と関連している(=欠測がランダムではない)ことを押さえると得点につながります。

学術的まとめ:なぜこれらの論文が重要か

  1. Redelmeier (2001) は「一見すると地位が健康に良い」という魅力的な仮説を提示した
  2. Sylvestre (2006) は「時間の数え方(不死時間)」という巧妙なバイアスを指摘し、科学的な厳密さを求めた
  3. Brown / Elton (1992, 1996) は「消えたデータ」を無視すると、実力がないのに「ある」ように見えてしまう市場の歪みを証明した

つまり、**「目に見える数字だけを信じるな、その数字が生まれるまでの『脱落プロセス』を想像せよ」**というのが、これら全ての論文に共通する教訓です。

覚え方

覚えフレーズ:「勝者しか見えない=負けが消えてる」

イメージ:集合写真を撮ったのに、途中で帰った人が写ってないのに「みんな楽しそうだった」と言ってしまう感じです

↓↓よろしければクリックをお願いいたします
にほんブログ村 哲学・思想ブログ 心理学へ 心理学ランキング
産業・組織
スポンサーリンク
スポンサーリンク
hosomeganeをフォローする
心理学用語の壁

コメント

タイトルとURLをコピーしました