Сравнение GPT-5.5, Claude Opus 4.7 и Gemini 3.1 Pro: где сильна каждая модель

Сравнение трёх флагманских моделей — GPT-5.5, Claude Opus 4.7 и Gemini 3.1 Pro — самый частый вопрос среди AI-практиков в 2026 году.

Сравнение бенчмарков

Метрика	Claude Opus 4.7	GPT-5.5	Gemini 3.1 Pro
Arena текст	1493 ±7	1488 ±10	1493 ±5
Arena код	1565	1500 (Codex)	не в топ-10
SWE-bench Pro	64.3%	58.6%	не опубликовано
HLE	46.9%	41.4%	не опубликовано
MRCR @ 1M	32.2%	74%	не опубликовано

Claude Opus 4.7: код и сложные рассуждения. Лучший результат в коде — 1565 в Arena, 64.3% в SWE-bench Pro.

GPT-5.5: длинный контекст и терминальные задачи. 74% в MRCR (значительно выше Claude 32.2%), 82.7% в Terminal-Bench 2.0.

Gemini 3.1 Pro: экономичный выбор. 1493 в Arena — наравне с Claude, но цена API примерно в 15 раз ниже GPT-5.5 Pro.