生存者バイアス:消えた銘柄がバックテストを歪ませる罠

概論

ある投資戦略のバックテストを行う際、私たちは過去のデータという「歴史書」を読み解くことになります。しかし、もしその歴史書が、成功した「生存者」の物語だけを記録し、途中で脱落した「敗者」の存在を抹消していたとしたら、どうでしょうか。その歴史書から導き出される教訓は、現実を著しく歪めた、過度に楽観的なものになってしまうでしょう。

これこそが、金融データ分析における最も古典的で、かつ最も陥りやすい罠の一つ、生存者バイアス(Survivorship Bias)です。

生存者バイアスとは、ある期間の分析を行う際に、その期間の最後まで生き残った対象(企業やファンド)のデータのみを用いてしまい、途中で消滅した対象(倒産、合併、成績不振による清算など)のデータを除外してしまうことによって生じる、統計的な偏りを指します。

この問題の深刻さを学術界に広く知らしめたのが、スティーブン・ブラウン、ウィリアム・ゲッツマン、ロジャー・イボットソン、ステファン・ロスによる1995年の有名な研究です [1]。彼らは、ミューチュアル・ファンドのパフォーマンスを分析する際に、途中で清算された成績の悪いファンドのデータを除外してしまうと、ファンド業界全体のパフォーマンスが、実際よりも遥かに良く見えてしまうことを実証しました。

株式市場においても、このバイアスは同様に深刻です。バックテストを行う際に、現在上場している銘柄のデータだけを使ってしまうと、過去に倒産したり、上場廃止になったりした「敗者」たちの悲惨なパフォーマンスが計算から抜け落ちてしまいます。その結果、どんな投資戦略であっても、そのリターンは体系的に過大評価されてしまうのです。

このバイアスを回避するためには、途中で消滅した銘柄のデータも全て含んだ、「バイアス・フリー」なデータベースを用いることが不可欠です。シカゴ大学証券価格調査センター(CRSP)のデータベースは、このような上場廃止銘柄のデータも網羅していることで知られており、信頼性の高い実証ファイナンス研究の基盤となっています。


長所・短所の解説、利益例・損失例の紹介

短所、弱み、リスクについて:幻想のアルファ(損失事例)

生存者バイアスに汚染されたデータを用いてバックテストを行うことは、意図せずして、存在しないはずの「幻想のアルファ」を生み出してしまいます。

市場リターンの過大評価

まず、市場全体の平均リターンそのものが、生存者バイアスによって嵩上げされます。ブラウンらの1992年の研究は、一般的な株価指数が、構成銘柄の入れ替えの際に、成績の悪くなった企業を除外し、好調な企業を追加することで、生存者バイアスを内包している可能性を指摘しています [2]。

ファクター・アノマリーの過大評価

このバイアスの影響は、バリューやサイズといったファクター・アノマリーの研究においても、極めて深刻です。

コタリ、シャンケン、スローンによる1995年の研究は、当時広く使われていたCompustatのデータベースに生存者バイアスが存在し、それがバリュー効果(ブックマーケット比率とリターンの関係)を人為的に強めて見せていた可能性を明らかにしました [3]。倒産するような財務的に脆弱な企業(多くは低ブックマーケット比率のグロース株)の壊滅的なパフォーマンスがデータから抜け落ちることで、バリュー株とグロース株のリターン差が、実際よりも大きく見えてしまっていたのです。

ヘッジファンド・データベースにおけるバイアス

生存者バイアスは、ヘッジファンドのパフォーマンス評価においても、常に議論の中心となってきました。

アッカーマン、マクアリー、マクドナルドによる1999年の研究は、主要なヘッジファンド・データベースを分析し、生存者バイアスが業界全体の平均リターンを年率で数パーセントも押し上げている可能性があることを示しました [4]。成績が悪化して清算されたファンドのデータは、データベースから静かに消え去り、優秀な成績を収めたファンドだけが残り続けるのです。

長所、強み、有用な点について:バイアスを理解し、回避する力

生存者バイアスは、それ自体が利益を生むものではありません。しかし、このバイアスの存在を深く理解し、それを回避するための手法を知ることは、他の投資家が陥る罠を避け、より信頼性の高い分析を行う上での、決定的な「強み」となります。

バイアス・フリーなデータセットの価値

生存者バイアスを回避する最も直接的な方法は、CRSPのように、上場廃止銘柄のデータも全て含んだ、バイアス・フリーなデータセットを用いることです。このような質の高いデータにアクセスし、それを正しく扱える能力そのものが、現代の計量ファイナンスにおけるエッジの源泉となります。

より現実的な期待リターンの設定

生存者バイアスの影響を認識することで、投資家は、様々な投資戦略に対する、より現実的で保守的なリターン期待を形成することができます。例えば、あるアクティブファンドの過去の優れたパフォーマンスを見た際に、「この記録は、途中で消えていった無数の失敗したファンドを含んでいない、生存者だけの結果ではないか?」と批判的に吟味する視点を持つことができます。

この懐疑的な視点は、過度に楽観的なバックテスト結果に飛びつくことを防ぎ、長期的な資産運用における規律を維持するための、強力な防衛策となります。近年の研究でも、例えばリャンによる2000年の研究は、ヘッジファンドのパフォーマンスを評価する上で、生存者バイアスだけでなく、自発的に報告をやめたファンドのデータ(自己選択バイアス)も考慮に入れる必要性を論じており、バイアスに対する理解はますます精緻化されています [5]。

非対称性と摩擦の視点から

なぜ、生存者バイアスはこれほどまでに根深く、多くの分析者を惑わせるのでしょうか。その本質を、当メディアの根幹をなす「非対称性と摩擦」の観点から解き明かすことができます。


Asymmetry:成功と失敗の「非対称な」可視性

生存者バイアスの根源には、成功と失敗の「可視性(visibility)」における、極端な非対称性が存在します。

成功した企業やファンドは、その物語が語り継がれ、その株価チャートは長期間にわたって参照され続けます。成功は、目立ち、記憶に残り、賞賛されます。一方で、失敗した企業やファンドは、静かに市場から姿を消します。倒産し、上場廃止となり、データベースからその記録が抹消されることさえあります。失敗は、忘れ去られ、不可視な存在となるのです。

この「成功は雄弁だが、失敗は沈黙する」という情報の非対称性が、私たちの世界認識を根本的に歪ませます。私たちが日常的に目にするのは、成功者たちのきらびやかな軌跡だけです。その裏に、無数の敗者たちの屍が積み上がっているという事実を、意識的に探さなければ、知ることはありません。

この非対称な情報環境が、投資家に過度な楽観主義を植え付け、リスクを過小評価させるのです。生存者バイアスとは、この非対称な歴史の記録そのものが作り出す、強力な認知の歪みと言えるでしょう。


Friction:データの「欠損」という根源的な摩擦

手数料やスプレッドのような基本的な摩擦に加え、生存者バイアスという問題には、より根源的で、克服が困難な「摩擦」が存在します。

データ収集の物理的摩擦

バイアスのない、完璧なデータセットを構築し、維持するためには、莫大なコストと労力がかかります。上場廃止になった企業の最後の株価や、清算されたファンドの最終的なパフォーマンスといった「敗者のデータ」を、正確に追跡し続けることは、極めて困難な作業です。

多くの商用データベース提供者にとって、このような手間のかかる作業は、商業的に見合わない場合があります。その結果、安価で手に入りやすいデータベースの多くは、この「敗者のデータ」が欠損した、生存者バイアスに汚染されたものになってしまいます。この「質の高いデータを手に入れるためのコスト」という物理的な摩擦が、多くの研究者や投資家が、不完全なデータを使わざるを得ない状況を生み出しているのです。

楽観主義という認知的摩擦

人間は、本能的に、成功の物語を好む傾向があります。ある投資戦略の素晴らしいバックテスト結果を見た際に、「この結果は生存者バイアスによって歪んでいるかもしれない」と、自らその輝かしい結果に水を差すような懐疑的な視点を持つことは、認知的に大きな負担を伴います

むしろ、その成功物語を信じたいという「確証バイアス」が働き、バイアスの可能性から目をそむけてしまうことの方が多いでしょう。「楽観的なストーリーを信じたい」という認知的な摩擦が、投資家が生存者バイアスの罠に何度も陥ってしまう、根本的な原因なのです。


総括

・生存者バイアスとは、分析対象の期間中に消滅した企業やファンドのデータを除外し、生き残った対象のデータのみで分析を行うことによって生じる、統計的な偏りです。

・このバイアスは、バックテストにおけるリターンを体系的に過大評価し、リスクを過小評価させるという、極めて危険な影響をもたらします [1]。

・特に、ミューチュアル・ファンド [2]やヘッジファンド [4]のデータベース、そしてファクター・アノマリーの研究 [3]において、その存在と影響の大きさが指摘されてきました。

・信頼性の高い分析を行うためには、上場廃止銘柄などのデータも全て含んだ「バイアス・フリー」なデータセットを用いることが不可欠であり、このバイアスの存在を常に意識する批判的な視点が求められます。


用語集

生存者バイアス (Survivorship Bias) 分析期間の最後まで生き残った対象のデータのみを用いて分析を行うことで、結果が体系的に(通常は良い方向に)歪められてしまう統計的な偏り。

バックテスト (Backtest) ある投資戦略が、過去の市場データを用いてシミュレーションした場合に、どのようなパフォーマンスを示したかを検証すること。

バイアス (Bias) 統計的な推定値などが、真の値から体系的にずれてしまう「偏り」のこと。

CRSP (Center for Research in Security Prices) シカゴ大学証券価格調査センター。上場廃止銘柄のデータも網羅した、質の高い株価データベースを提供していることで知られ、信頼性の高い学術研究の基盤となっている。

Compustat S&P Global社が提供する、企業の財務データベース。初期のバージョンには生存者バイアスが存在することが指摘された。

ヘッジファンド 私募によって機関投資家や富裕層から資金を集め、様々な複雑な手法を駆使して、市場環境に関わらず絶対的なリターンを追求するファンド。

アノマリー (Anomaly) 現代ファイナンス理論の常識では説明できないが、市場で経験的に観測されるリターンの規則性。

リスク調整後リターン リターンの絶対額だけでなく、そのリターンを得るためにどれだけのリスクを取ったかを考慮に入れたリターンのこと。

自己選択バイアス (Self-Selection Bias) 分析対象となるデータが、対象自身の自発的な選択によって集められる場合に生じるバイアス。例えば、成績の良いヘッジファンドだけが、データベースへのデータ提供に協力する場合など。

ポートフォリオ 投資家が保有する、株式、債券、不動産などの金融資産の組み合わせ、またその一覧。


参考文献一覧

[1] Brown, S. J., Goetzmann, W., Ibbotson, R. G., & Ross, S. A. (1995). Survivorship bias in performance studies. In The Performance of Mutual Funds (pp. 238-256). Oxford University Press.
※書籍です

[2] Brown, S. J., & Goetzmann, W. N. (1995). Performance persistence. The Journal of Finance, 50(2), 679-698.
https://doi.org/10.1111/j.1540-6261.1995.tb04800.x

[3] Kothari, S. P., Shanken, J., & Sloan, R. G. (1995). Another look at the cross‐section of expected stock returns. The Journal of Finance, 50(1), 185-224.
https://doi.org/10.1111/j.1540-6261.1995.tb05171.x

[4] Ackermann, C., McEnally, R., & MacDonald, D. (1999). The performance of hedge funds: Risk, return, and incentives. The Journal of Finance, 54(3), 833-874.
https://doi.org/10.1111/0022-1082.00129

[5] Liang, B. (2000). Hedge funds: The living and the dead. Journal of Financial and Quantitative Analysis, 35(3), 309-326.
https://doi.org/10.2307/2676206

【免責事項】

本サイト/本記事は、著者個人の見解、経験、学習・研究内容に基づいた情報提供を目的としています。特定の銘柄や投資手法の推奨を目的としたものではなく、また、金融商品取引法に基づく投資助言サービスではありません。

投資には元本割れを含む様々なリスクがあります。価格変動、金利変動、為替変動、発行者の信用状況などにより、損失が生じる可能性があります。

本サイト/本記事で提供される情報を利用した投資判断や取引によって生じたいかなる損害についても、筆者および運営者は一切の責任を負いません。

投資に関する最終的な決定は、ご自身の判断と責任において行って(あるいは行わないで)ください。

コメント

タイトルとURLをコピーしました