C
ChaoBro

Grok 4.3 вышел без шума: Intelligence Index AA — 53 балла, входная цена снижена на 40%

Grok 4.3 вышел без шума: Intelligence Index AA — 53 балла, входная цена снижена на 40%

Основной вывод

xAI выпустила модель тяжёлого класса самым xAI-образным способом: без пресс-конференции, без блога — просто выложили прямо в API.

Grok 4.3 тихо заработал на платформах вроде Venice, поддерживая контекст в 1 миллион токенов, вызов функций, мультимодальный ввод и нативный поиск X. Модель набрала 53 балла на Intelligence Index от Artificial Analysis, опередив Muse Spark, Claude Sonnet 4.6 и предыдущие версии Grok. Цены API были одновременно скорректированы: входные данные снизились с $2,10 до $1,25 за миллион токенов (снижение на 40%), выходные — на 60%.

Результаты бенчмарков

Intelligence Index от Artificial Analysis

МодельAA IndexПримечания
GPT-5.5 Pro~60+Текущий лидер
Grok 4.353Обогнал Muse Spark, Sonnet 4.6
Muse Spark<53Обогнан Grok 4.3
Claude Sonnet 4.6<53Обогнан Grok 4.3
Gemini 3.1 Pro~50Близок к Grok 4.3

Рейтинги Vals Index

БенчмаркПозиция Grok 4.3Примечания
Общий#13Выше среднего
CaseLaw#1Ведущее юридическое обоснование
CorpFin#1Ведущий анализ корпоративных финансов
Общее программированиеСлабоеНе сильная сторона

Бенчмарк GDPval-AA

Наиболее значительное улучшение Grok 4.3 — в реальных агентских задачах. На бенчмарке GDPval-AA показатель агентских способностей Grok 4.3 существенно вырос. Это ключевой метрикой для оценки «может ли ИИ самостоятельно выполнять задачи».

Анализ ценовой стратегии

ПараметрGrok 4.3Изменение
Цена входных данных$1,25/млн токенов↓ 40%
Цена выходных данныхЗначительно снижена↓ 60%
Контекстное окно1 млн токеновКак у предыдущей

Эта ценовая стратегия чрезвычайно агрессивна. Цена в $1,25 за миллион входных токенов уже ниже, чем у большинства моделей среднего уровня, при этом производительность Grok 4.3 находится в первом эшелоне. xAI явно идёт по «маршруту цена-качество» — предоставляя производительность, близкую к Claude Opus 4.7, по ценам, приближающимся к DeepSeek V4.

Горизонтальное сравнение с конкурентами

ПараметрGrok 4.3Claude Sonnet 4.6GPT-5.5DeepSeek V4
AA Index53<53~60+Н/Д
Цена входных$1,25/млн~$3/млн~$5/млн~$0,15/млн
Юридическое обоснование#1СильноеСильноеСреднее
Финансовый анализ#1СильноеСильноеСреднее
Общее программированиеСлабоеСильноеСильноеСильное
Агентские способностиЗначительно улучшеныСильныеСильныеСильные

Оценка ситуации

Релиз Grok 4.3 передаёт несколько сигналов:

  1. xAI переходит из «догоняющих» в «лидеров по соотношению цена-качество»: AA-индекс 53 при цене $1,25 обеспечивает гораздо лучшую ценность, чем Claude и GPT
  2. Явное преимущество в специализированных областях: Первые места в CaseLaw и CorpFin показывают, что у Grok 4.3 есть уникальные преимущества в юридических и финансовых вертикалях
  3. Тихий запуск показывает, что xAI ставит продукт выше маркетинга: Это одновременно и сила (прагматичность), и слабость (низкая видимость)

Как использовать

  • Юристы и финансовые специалисты: Первые места Grok 4.3 в CaseLaw и CorpFin заслуживают внимания — возможно, самый экономичный выбор специализированной модели
  • Пользователи API: Входная цена $1,25/млн + 53 балла производительности делают это самым дешёвым вариантом среди моделей первого эшелона
  • Разработчики агентов: Значительное улучшение на GDPval-AA означает, что надёжность Grok 4.3 в агентских сценариях существенно выросла — стоит протестировать