【要約】AI時代のバックテスト過学習入門：PBO論文をUSDJPY実験で読む [Qiita_Trend] | Summary by TechDistill

> Source: Qiita_Trend

Execute Primary Source

// Problem

クオンツトレーダーが、AIや計算資源を用いて大量の戦略を探索する際、統計的な罠に直面する。膨大な試行回数は、偶然のノイズに適合した「見かけ上の高成績戦略」を生み出す。

・多重検定問題による、偽陽性の発生。
・IS（インサンプル）成績とOOS（アウトオブサンプル）成績の著しい乖離。
・IS Sharpeが高いほど、選択バイアスによりOOS性能が低下する負の相関。

// Approach

筆者は、Baileyらの論文に基づき、USDJPYの60分足データを用いた実験を通じて過学習を評価する。統計的な厳密性を確保するため、以下の手法を採用した。

・CSCV（組合せ対称交差検証）による、時系列構造を保持した検証。
・PBO（バックテスト過学習確率）を用いた、選択プロセスの信頼性評価。
・4つの相補的な指標（PBO、劣化度、損失確率、確率的優位性）による多角的な分析。

// Result

144通りのMAクロス戦略を用いた実験により、選択バイアスの実態を定量的に明らかにした。統計的な優位性と経済的な収益性の乖離が示された。

・IS Sharpe 0.75の戦略が、OOSでは平均0.12まで劣化（約84%の消失）。
・簡易PBOは5.71%だが、OOS損失確率は35.71%に達する。
・「順位が上位でも、絶対リターンはマイナスになり得る」ことを実証。

Senior Engineer Insight

> AIによる自動生成ルールが主流となる中、PBOは必須の検疫プロセスとなる。ただし、CSCVを最適化の目的関数に組み込む「指標への過学習」は厳禁だ。また、スプレッドやスリッページ等の実運用コストを無視した検証は、いかなる統計的厳密性をもってしても無価値である。実戦では、統計的有意性と経済的合理性の両面を監視せよ。

TechDistill.dev

【要約】AI時代のバックテスト過学習入門：PBO論文をUSDJPY実験で読む [Qiita_Trend] | Summary by TechDistill

// Problem

// Approach

// Result

Senior Engineer Insight

[ RELATED_KERNELS_DETECTED ]

Suspecting AI cheating, Ivy League prof ordered in-person final; scores fell 50%

Ask HN: Another "Hacker News" with less AI and more human-focused hacking news?

SWE-1.7 Reach Near GPT 5.5 and Opus Intelligence

How AI could enable autonomous robot workers in workplaces—and maybe homes