C
ChaoBro

Grok 4.3がサイレントローンチ:AA知能指数53点、入力価格40%カット

Grok 4.3がサイレントローンチ:AA知能指数53点、入力価格40%カット

核心的な結論

xAIは最もxAIらしい方法でヘビー級モデルをリリースした:プレス会議なし、ブログ記事なし、APIに直接投入しただけ。

Grok 4.3はVeniceなどのプラットフォームでひっそりと稼働を開始し、100万トークンのコンテキスト、関数呼び出し、マルチモーダル入力、ネイティブX検索をサポートしている。Artificial Analysis知能指数で53点を達成し、Muse Spark、Claude Sonnet 4.6、前世代Grokを上回った。API価格も同時に調整され、入力は$2.10から$1.25/Mトークンに(40%カット)、出力は60%カットされた。

ベンチマーク性能

Artificial Analysis 知能指数

モデルAA指数備考
GPT-5.5 Pro約60+現在のリーダー
Grok 4.353Muse Spark、Sonnet 4.6を上回る
Muse Spark53未満Grok 4.3に抜かれる
Claude Sonnet 4.653未満Grok 4.3に抜かれる
Gemini 3.1 Pro約50Grok 4.3に近い

Vals Index ランキング

ベンチマークGrok 4.3順位備考
総合#13平均以上
CaseLaw#1法推理でトップクラス
CorpFin#1企業金融分析でトップクラス
一般プログラミング弱い得意分野ではない

GDPval-AA ベンチマーク

Grok 4.3の最も重要な改善は実世界のAgentタスクにある——GDPval-AAベンチマークで、Grok 4.3のエージェンティック能力スコアは大幅に向上した。これは「AIがタスクを独立して完了できるか」を測定する核心指標だ。

価格戦略分析

項目Grok 4.3変化
入力価格$1.25/Mトークン↓ 40%
出力価格大幅削減↓ 60%
コンテキストウィンドウ100万トークン前代と同様

この価格戦略は極めて攻撃的だ。$1.25/Mトークンの入力価格はすでに大多数の中堅モデルを下回っているが、Grok 4.3の性能は第一梯队に位置している。xAIは明らかに**「コスパ路線」**を追求している——DeepSeek V4に近い価格でClaude Opus 4.7に近い性能を提供する。

競合他社との横断比較

次元Grok 4.3Claude Sonnet 4.6GPT-5.5DeepSeek V4
AA指数5353未満約60+N/A
入力価格$1.25/M約$3/M約$5/M約$0.15/M
法推理#1強い強い
金融分析#1強い強い
一般プログラミング弱い強い強い強い
Agent能力大幅改善強い強い強い

市場分析

Grok 4.3のリリースはいくつかのシグナルを送っている:

  1. xAIは「追撃者」から「コスパリーダー」へと移行している:53点のAA指数に$1.25の価格で、ClaudeやGPTを遥かに凌ぐコストパフォーマンス
  2. 専門分野での明確な優位性:CaseLawとCorpFinでの#1ランキングは、Grok 4.3が法務・金融垂直シナリオで独特の優位性を持っていることを示す
  3. サイレント launchesはxAIがマーケティングより製品を重視していることを示す:これは長所(実務的)でもあり短所(知名度不足)でもある

活用方法

  • 法務・金融従事者:Grok 4.3のCaseLawとCorpFinでの#1ランキングは注目価値がある——おそらく最もコストパフォーマンスの高い専門モデルの選択肢
  • APIユーザー:$1.25/Mの入力価格 + 53点の性能は、第一梯队モデルの中で最も安いオプション
  • Agent開発者:GDPval-AAでの大幅な改善は、Grok 4.3のAgentシナリオでの信頼性が著しく向上したことを意味する——試す価値あり