AI企業が自社モデルを「公開できないほど強力」と発見したとき、この業界は微妙な閾値を越えた。
結論
Claude 5「Mythos」はベータ段階に入ったが、Anthropicは公開に極めて慎重だ。Claude Consoleで発見されたclaude-jupiter-v1-pモデル識別子と5月6日の開発者イベントは正式版が近いことを示唆しているが、Polymarketの予測では6月前の公開確率は50%未満。
Mythosが示したもの
- 23年間のゼロデイ発見: Mythosは23年間世界中のトップハッカーが見逃していたセキュリティ脆弱性を独立して発見
- バッチ発見: 確認済み5件、未検証候補数百件
- ハッキングツールとして訓練されたわけではない: Anthropicはこれらのセキュリティ能力が汎用コード理解能力の自然な延伸であると強調
まとめ
Claude Mythosの「公開できないほど強力」というジレンマは、AI業界が汎用能力とセキュリティリスクの構造的矛盾に初めて正面から向き合った事例だ。
ソース: