【要約】Amid Mythos’ hyped cybersecurity prowess, researchers find GPT-5.5 is just as good [Ars_Technica] | Summary by TechDistill

> Source: Ars_Technica

AI開発企業がモデルの危険性を強調する中、脅威の性質が不明確であった。AnthropicはMythos Previewの脅威を強調し、限定公開を行った。サイバー攻撃能力の向上が、モデル固有の特性か汎用的な能力向上によるものか、検証が必要であった。

AISIは、AIモデルのサイバー攻撃能力を定量的に評価するため、多角的なテストを実施した。AISIは95種類のCTFチャレンジを用いて、モデルの能力を検証した。具体的には以下の手法を用いた。

GPT-5.5は、Mythos Previewと同等、あるいはそれ以上の性能を記録した。AISIのテストにおいて、GPT-5.5は以下の成果を示した。

> サイバー能力の向上は、推論やコーディングといった汎用能力の向上に起因する。これは、特定の攻撃モデルより、モデル全体の自律性の進化を注視すべきことを示唆する。防御側の自動化には極めて有用だが、攻撃の自動化リスクも同時に高まる。実戦投入時は、APIコストと解析精度のバランスを評価すべきである。

TechDistill.dev