概論
もし、あなたがタイムマシンで過去に戻り、未来の株価を知っていたとしたら、億万長者になるのは簡単でしょう。バックテストの世界で、これと全く同じ、しかし遥かに巧妙で見抜きにくい形で発生するエラーがルックアヘッドバイアス(Look-Ahead Bias)です。
ルックアヘッドバイアスとは、投資戦略のバックテストを行う際に、そのシミュレーション上の取引時点では、本来利用できなかったはずの「未来の」情報を使ってしまうことによって生じる、統計的な偏りを指します。
これは、生存者バイアスと並んで、バックテストの信頼性を根底から覆す、最も深刻で、かつ陥りやすい罠の一つです。このバイアスは、しばしば意図せず、巧妙な形で紛れ込みます。例えば、最も古典的で分かりやすい例は、企業の財務データを使った戦略の検証です。
ある企業の12月期決算の最終的な財務データ(売上高や利益など)が、一般の投資家がアクセスできる形で公表されるのは、通常、翌年の3月や4月です。しかし、バックテストのプログラムを組む際に、12月末時点の取引判断の箇所で、本来はまだ誰も知らないはずの、その12月期の最終データを使ってしまう。これがルックアヘッドバイアスです。シミュレーションの中のあなたは、未来の新聞を盗み見て取引しているのと同じことになります。
このようなバイアスの存在は、初期のファクター研究の時代から、学術界で常に厳しいチェックの対象となってきました。例えば、バンツとブリーンによる1986年の研究は、初期のサイズ効果やバリュー効果の研究に対して、このルックアヘッドバイアスの問題が含まれている可能性を指摘し、厳密な検証の重要性を問いかけました [1]。
このバイアスがひとたび紛れ込むと、バックテストは現実には決して達成不可能な、驚異的なパフォーマンスを示します。それはもはや、投資戦略の有効性を測るシミュレーションではなく、単なる「幻想」を描き出す装置と化してしまうのです。
長所・短所の解説、利益例・損失例の紹介
短所、弱み、リスクについて:未来情報が描く幻想のパフォーマンス(損失事例)
ルックアヘッドバイアスは、バックテストの結果を人為的に、そして劇的に良く見せてしまうため、それに気づかずに構築された戦略は、現実の市場では必ず失敗します。
会計データベースに潜む罠
歴史的なファクター研究において、ルックアヘッドバイアスの最大の発生源となってきたのが、会計データベースの扱いです。
Compustatのような主要なデータベースは、企業の過去の財務データを網羅していますが、そのデータは後から修正されたり、倒産後にデータが追加されたりすることがあります。もし、1990年時点の取引をシミュレートするために、2020年時点にダウンロードしたデータベースをそのまま使ってしまうと、1990年には存在しなかった情報や、後から訂正された正確な情報を「盗み見」してしまうことになります。
ファーマとフレンチが1992年の論文でバリュー効果を検証した際、彼らが会計データ(ブックマーケット比率)の使用を、決算期末から最低でも6ヶ月遅らせるという厳格なルールを課したのは、まさにこのバイアスを回避するためでした [2]。
インデックス構成銘柄の変更
もう一つの古典的な罠が、株価指数の構成銘柄の扱いです。例えば、「S&P500構成銘柄の中から、特定の条件を満たす銘柄に年初に投資する」という戦略を検証する場合を考えます。もし、その年の「年末時点」での構成銘柄リストを使って、1月1日の投資判断を行ってしまえば、それはルックアヘッドバイアスです。
年内にどの銘柄が指数から除外され、どの銘柄が採用されるかは、1月1日時点では誰も知り得ません。ハリスとグレルの1986年の研究が示すように、指数の構成銘柄の変更は、株価に大きな影響を与えるイベントであり、その情報は事前には利用不可能なのです [3]。
過大評価されたアルファ
近年の包括的なバックテスト研究は、このようなバイアスを排除した際に、過去に報告された多くのアノマリーのリターンがどれだけ「縮小」するかを明らかにしています。ハーヴェイとリューによる2015年のバックテストに関するレビュー論文は、ルックアヘッドバイアスがいかに巧妙な形で現れるか、その多様なパターンを解説しています [4]。
長所、強み、有用な点について:バイアスを回避するための規律
ルックアヘッドバイアスは、それ自体が利益を生むものではありません。しかし、このバイアスの存在を深く理解し、それを回避するための規律を知ることは、他の投資家が陥る罠を避け、より信頼性の高い分析を行う上での、決定的な「強み」となります。
データのタイムスタンプを厳格に管理する
バイアスを回避するための最も基本的な規律は、「その情報が、いつ本当に利用可能になったか」を、徹底的に検証することです。会計データであれば、EDGARなどの公的な開示日でタイムスタンプを押す。ニュースであれば、その報道日時を記録する。この地道な作業が、未来情報の意図せぬ混入を防ぎます。
ポイント・イン・タイム・データベースの活用
より高度な解決策が、ポイント・イン・タイム・データベースの活用です。これは、過去のある時点において、投資家がどのようなデータ(訂正前のデータや、まだ追加されていなかった企業のデータを含む)にアクセスできたかを、そのままの形で保存している特殊なデータベースです。これにより、研究者は、より現実に近い情報環境でバックテストを行うことができます。
現実的な期待リターンの形成(収益事例)
ルックアヘッドバイアスを排除した、信頼性の高いバックテストを行うことの「収益」とは、より現実的で、達成可能なリターン期待を形成できることです。
アーノットらの2019年による、数百のアノマリーの再現を試みた大規模な研究は、その好例です [5]。彼らは、ルックアヘッドバイアスを含む、あらゆるバックテスト上のバイアスを厳格に排除して再検証を行いました。その結果、過去の論文で報告された驚異的なアルファの多くは、現実的な取引ルールとバイアス排除の下では、大幅に縮小することを示しました。これは悲観的な結果に見えますが、同時に、幻想のアルファを追い求めることから投資家を解放し、どのエッジが本当に頑健であるかを見極めるための、より強固な土台を提供するのです。
非対称性と摩擦の視点から
なぜ、ルックアヘッドバイアスはこれほどまでに頻繁に、そして巧妙な形で発生するのでしょうか。その本質を、当メディアの根幹をなす「非対称性」と「摩擦」の観点から解き明かすことができます。
Asymmetry:過去と未来の「情報の非対称性」
ルックアヘッドバイアスの根源には、バックテストを行う者と、現実の市場参加者との間に存在する、決定的な「情報の非対称性」があります。
現実の市場で取引を行う私たちは、常に「過去は既知、未来は未知」という、非対称な情報環境に置かれています。私たちは、過去のデータに基づいて未来を予測しようとしますが、未来そのものを知ることは決してできません。
一方で、バックテストを行う者は、分析期間の始めから終わりまでの全てのデータが揃った、完璧なデータセットを目の前にしています。彼らの視点からは、シミュレーション上の「過去」と「未来」は、全て見通せる、いわば対称的な情報環境です。
ルックアヘッドバイアスとは、このバックテスターが持つ神のような「対称的な情報」を、現実の市場参加者の「非対称な情報」環境に、誤って持ち込んでしまうことで発生します。バックテストの中では、未来の情報を「盗み見る」ことで、非対称性が存在しないかのように振る舞えてしまう。この特権的な立場こそが、現実には存在しないはずの超過リターンを生み出すのです。
Friction:データベースの「利便性」という摩擦
手数料やスプレッドのような基本的な摩擦に加え、ルックアヘッドバイアスという問題には、データ環境そのものに起因する、構造的な「摩擦」が存在します。
データベースの構造という摩擦
私たちが通常利用する多くの金融データベースは、「現在の視点から見て、最も正確でクリーンな過去のデータ」を提供するように設計されています。つまり、過去に存在したデータの誤りは修正され、後から倒産した企業の情報も遡って整備されています。
この「利便性の高い」データベースの構造そのものが、摩擦として機能します。ルックアヘッドバイアスを回避するためには、過去のある時点において、投資家が実際にどのような(不正確で、不完全な)情報にアクセスできたかを再現する、「ポイント・イン・タイム」という特殊で高価なデータセットを使うか、あるいはファーマとフレンチのように、情報の公表日を慎重に調査し、データを意図的に遅らせるという、手間のかかる作業(摩擦の克服)が必要になります [2]。多くの研究者や開発者は、この摩擦を乗り越えられず、利便性の高い、しかしバイアスに汚染されたデータを使ってしまうのです。
後知恵バイアスという認知的摩擦
ルックアヘッドバイアスは、人間の「後知恵バイアス(Hindsight Bias)」という、根深い認知的な摩擦と密接に関連しています。私たちは、一度結果を知ってしまうと、あたかも最初からその結果を予測できたかのように考えてしまう傾向があります。
バックテストを設計する際、この後知恵バイアスが働くと、無意識のうちに、当時利用できなかったはずの情報をモデルに組み込んでしまいがちです。「あの時、この指標を使っていれば、この暴落を避けられたはずだ」という発想は、多くの場合、未来情報を利用した、ルックアヘッドバイアスの温床となるのです。
総括
・ルックアヘッドバイアスとは、バックテストにおいて、シミュレーション上の取引時点では利用できなかったはずの「未来の」情報を使ってしまうことで生じる、致命的なエラーです。
・会計データの安易な使用 [1, 2]や、将来のインデックス構成銘柄の知識 [3]などが、その古典的な発生源として知られています。
・このバイアスは、バックテストの結果を非現実的なほど良く見せてしまい、それに基づいて構築された戦略は、現実の市場では必ず失敗運命にあります。
・信頼性の高いバックテストを行うためには、情報のタイムスタンプを厳格に管理し、意図せぬ未来情報の混入を避けるという、徹底した規律が不可欠です [4, 5]。
用語集
ルックアヘッドバイアス (Look-Ahead Bias) バックテストにおいて、シミュレーション上の取引時点では利用できなかったはずの「未来の」情報を使ってしまうことで生じる統計的な偏り。
バックテスト (Backtest) ある投資戦略が、過去の市場データを用いてシミュレーションした場合に、どのようなパフォーマンスを示したかを検証すること。
生存者バイアス (Survivorship Bias) 分析期間中に消滅した対象(企業やファンド)のデータを除外し、生き残った対象のデータのみで分析を行うことで生じる統計的な偏り。ルックアヘッドバイアスと並ぶ、代表的なバックテストの罠。
ポイント・イン・タイム・データベース (Point-in-Time Database) 過去のある時点において、投資家がどのような情報(訂正前のデータなどを含む)にアクセスできたかを、そのままの形で保存している特殊なデータベース。ルックアヘッドバイアスの回避に極めて有効。
タイムスタンプ (Timestamp) あるデータが記録されたり、利用可能になったりした日時を示す情報。
S&P500 米国の代表的な株価指数の一つ。構成銘柄は定期的に見直されるため、そのリストの扱いがルックアヘッドバイアスの原因となりうる。
Compustat S&P Global社が提供する、企業の財務データベース。遡及的なデータの修正などを含むため、使用にはルックアヘッドバイアスへの注意が必要。
CRSP (Center for Research in Security Prices) シカゴ大学証券価格調査センター。質の高い株価データベースを提供しており、学術研究の標準となっている。
データマイニング (Data Mining) 大量のデータを分析し、本来は意味のない偶然の相関関係を、意味のある規則性であるかのように見つけ出してしまうこと。
アルファ (Alpha) 市場や他のファクターの動きでは説明できない、その資産固有の超過リターン。ルックアヘッドバイアスは、このアルファを幻想的に嵩上げする。
参考文献一覧
[1] Banz, R. W., & Breen, W. J. (1986). Sample-dependent results using accounting and market data: Some evidence. The Journal of Finance, 41(4), 779-795.
https://doi.org/10.2307/2328228
[2] Fama, E. F., & French, K. R. (1992). The cross‐section of expected stock returns. The Journal of Finance, 47(2), 427-465.
https://doi.org/10.1111/j.1540-6261.1992.tb04398.x
[3] Harris, L., & Gurel, E. (1986). Price and volume effects associated with changes in the S&P 500 list: New evidence for the existence of price pressures. The Journal of Finance, 41(4), 815-829.
https://doi.org/10.2307/2328230
[4] Harvey, C. R., & Liu, Y. (2015). Backtesting. In Handbook of High-Frequency Trading and Modeling in Finance. Wiley.
※書籍です。
[5] Arnott, R. D., Harvey, C. R., Kalesnik, V., & Linnainmaa, J. T. (2019). Alice’s adventures in factorland: Three blunders that plague factor investing. The Journal of Portfolio Management, 45(4), 18-36.
https://doi.org/10.3905/jpm.2019.45.4.018
本サイト/本記事は、著者個人の見解、経験、学習・研究内容に基づいた情報提供を目的としています。特定の銘柄や投資手法の推奨を目的としたものではなく、また、金融商品取引法に基づく投資助言サービスではありません。
投資には元本割れを含む様々なリスクがあります。価格変動、金利変動、為替変動、発行者の信用状況などにより、損失が生じる可能性があります。
本サイト/本記事で提供される情報を利用した投資判断や取引によって生じたいかなる損害についても、筆者および運営者は一切の責任を負いません。
投資に関する最終的な決定は、ご自身の判断と責任において行って(あるいは行わないで)ください。
コメント