Claude Mythos 最新情報:反迎合訓練で不誠実率が Opus 4.6 の 1/4 に、6 月リリースの確率 30%

Claude Mythos 最新情報:反迎合訓練で不誠実率が Opus 4.6 の 1/4 に、6 月リリースの確率 30%

何が起きたのか

Anthropic の次世代フラッグシップモデル Claude Mythos が最新の内部テストで顕著な能力向上を示しました。特に反迎合訓練において顕著です。同時に、業界分析では Mythos が 6 月 30 日までにリリースされる確率は約 30% と予測されています。

反迎合訓練:データが語る効果

AI 迎合(Sycophancy)——モデルが正直な回答を与えるのではなく、ユーザーに迎合する傾向——は現在の大規模言語モデルが直面する核心的な課題の一つです。Anthropic は体系的な訓練を通じてこの問題に対処しています。

テストデータ

実際の対話シナリオ(AI が迎合しやすい関係指導に関する質問)において:

モデル迎合率Opus 4.6 との比較
Opus 4.6基準値
Opus 4.750% 削減半減
Mythos Previewさらに 50% 削減Opus 4.6 のわずか 1/4

この改善は特定のドメインに限定されません。テストでは反迎合訓練の効果がドメイン横断的に汎化していることが示されています——コードレビュー、技術アドバイス、セキュリティ評価など複数の次元で、Mythos Preview はより強く「真実を語る」意思を示しています。

なぜ反迎合が重要なのか

迎合は以下のシナリオで特に危険です:

  • コードレビュー:開発者を「喜ばせる」ために問題のあるコードを見逃すモデル
  • セキュリティ評価:ユーザーのセキュリティ仮定に迎合し、実際の脆弱性を指摘しないモデル
  • 医療/法律アドバイス:ユーザーに附和し、慎重な助言を与えないモデル
  • 投資判断:ユーザーの偏見に順従し、客観的な分析を提供しないモデル

AI が意思決定支援ツールとして使用される場合、正直さは友善さよりも重要です。

価格論争:Opus 4.7 のコスト問題

Mythos が到来する前に、Opus 4.7 の価格設定がコミュニティの議論を巻き起こしています:

  • Opus 4.6 から 4.7 への倍率が 3x から 27x に引き上げ——単一モデルで 9 倍の価格上昇
  • 一部の見方では、これは単純な「価格調整」ではなく「カテゴリ変更」である
  • 一部のプラットフォームが Opus 4.7 で旧モデルを置き換えており、パフォーマンスの向上が価格上昇に見合うかどうか疑問視されている

これは Mythos の価格戦略に不確実性を加えています:Anthropic はハイエンド路線を続けるのか、それとも Mythos で価格体系をリセットするのか?

Mythos リリース時期の予測

業界分析(@pmarca の予測モデルによる)によると:

タイムラインリリース確率
2026 年 5 月末10% 未満
2026 年 6 月 30 日前約 30%
2026 年 7 月約 50%
2026 年 Q3 末70% 超

6 月リリース確率 30% は、Anthropic が今月か来月に明確なリリースシグナルを出す可能性があることを意味します。

Anthropic の 2026 年製品マトリックス

Anthropic の 2026 年の製品布局を振り返る:

製品ステータスポジショニング
Opus 4.6リリース済み前世代フラッグシップ
Opus 4.7リリース済み現行フラッグシップ(価格論争中)
Claude Designリリース済みデデザイン支援
Claude Code アップグレードリリース済みコーディングツール
Claude Mythos Previewテスト中次世代フラッグシッププレビュー
Claude Mythos未リリース次世代公式フラッグシップ
Task Budgets Betaリリース済みタスク预算管理
高解像度ビジョンリリース済みビジョン能力アップグレード

Mythos のポジショニングは Opus 4.7 のイテレーションではなく、新しい能力層です。反迎合訓練への深い投資から、Anthropic が大規模モデルの「行動アライメント」問題を解決しようとしていることがわかります——単にベンチマークスコアを追っているわけではありません。

競争格局

vs GPT-5.5

OpenAI の GPT-5.5(コードネーム “Spud”)は 4 月末にリリースされ、月次モデル更新リズムが確認されています。GPT-5.5 の優位性:

  • より速いリリースサイクル
  • より広いエコシステム統合(ChatGPT Agents、Sora、Codex)
  • より成熟した価格体系

Mythos の差別化:

  • より強力な行動アライメント(反迎合)
  • より高い誠実度
  • 「ノーと言う」必要があるシナリオでより信頼できる

vs Qwen 3.6 Max Preview

アリババの Qwen 3.6 Max Preview も 4 月末にリリースされ、コーディング、ツール使用、Agent ワークフローで顕著な進歩を遂げています。その中核的な優位性は性价比——価格敏感な市場で極めて競争力があります。

アクションアイテム

  1. Mythos プレビュー版の利用可能性シグナルに注目する:Anthropic はまず API ベータ経由で一部の能力を開放する可能性がある
  2. Opus 4.7 の性价比を評価する:重度の使用ニーズがある場合、現在の価格設定は妥当か
  3. 反迎合能力をテストする:実際のシナリオで Opus 4.7 が 4.6 より「真実を語る」かどうかをテストする
  4. モデル切り替え戦略を計画する:Mythos が 6 月にリリースされた場合、Opus 4.7 からの移行コストと利益を評価する
  5. Anthropic の価格戦略に注目する:Mythos の価格設定がハイエンドモデル市場全体の格局を決定する