Релиз Google Gemini 3.1 Ultra: контекст на 2 миллиона токенов и эпоха нативной мультимодальности

Основной релиз

В этом месяце Google выпустила Gemini 3.1 Ultra, которую AI Tools Recap назвали «самым важным инфраструктурным релизом месяца».

Три ключевые особенности заслуживают отдельного внимания:

Окно контекста на 2 миллиона токенов

Это внушительная цифра. 2 миллиона токенов примерно эквивалентны 1,5 миллионам английских слов или в 1,5 раза превышают объем 600-страничного романа. В рамках такого окна контекста Gemini способна:

Единоразово прочитать всю техническую документацию
Проанализировать многочасовые протоколы совещаний
Обработать весь код крупных репозиториев

Для сравнения, окно контекста OpenAI GPT-4o составляет 128 тыс. токенов, а Claude Opus 4 — 200 тыс. Контекст Gemini 3.1 Ultra в 10–15 раз больше, чем у конкурентов.

По-настоящему нативная мультимодальность

«Нативная мультимодальность» Gemini 3.1 Ultra — это не просто маркетинговый лозунг. Модель напрямую оперирует текстом, изображениями, аудио и видео, не требуя промежуточных слоев транскрипции.

Что это значит? Ранние мультимодальные модели при обработке видео обычно сначала конвертировали кадры в текстовые описания, и только затем анализировали их — в этом процессе терялось огромное количество визуальной и временной информации. Gemini 3.1 Ultra работает непосредственно с исходными видеокадрами, сохраняя полную пространственно-временную информацию.

Встроенное выполнение кода в песочнице

Gemini 3.1 Ultra оснащена инструментом выполнения кода в изолированной среде (песочнице) — модель может писать и запускать код прямо в диалоге. Это не просто «рекомендация фрагмента кода», а прямое выполнение в безопасной песочнице с последующим возвратом результата вам.

Для таких задач, как анализ данных, научные вычисления и визуализация, это практически устраняет всю цепочку «скопировать код → открыть Jupyter → вставить → запустить → посмотреть результат».

Хронология релизов Google

Этот релиз не является изолированным событием. Google находится в плотном цикле выпуска ИИ-продуктов:

12 мая: Прямая трансляция Google Android Show, анонс Android 17 и агентных обновлений Gemini
19–20 мая: Конференция Google I/O 2026

Выпуск Gemini 3.1 Ultra в это время явно призван разогреть интерес к конференции I/O. Вполне логично ожидать, что на I/O будет представлено еще больше продуктов экосистемы Gemini.

Конкурентный ландшафт

Позиции Google в гонке моделей претерпевают тонкие изменения:

Параметр	Google Gemini 3.1 Ultra	Anthropic Claude	OpenAI GPT-5.5
Окно контекста	2 млн токенов	200 тыс. токенов	128 тыс. токенов
Нативная мультимодальность	✅ Текст/Изображения/Аудио/Видео	✅ Текст/Изображения	✅ Текст/Изображения/Аудио
Выполнение кода	✅ Встроенная песочница	❌ Требуется Claude Code	❌ Требуется Codex
Стратегия открытого кода	Частично открыта	Закрыта	Закрыта

Стратегия Google становится всё более очевидной: создание технологического рва за счет инфраструктурных преимуществ (вычислительные мощности, контекст, глубина мультимодальности) при сохранении частичной открытости кода для привлечения сообщества разработчиков.

Скрытые риски

Контекст на 2 миллиона токенов не дается даром. Стоимость инференса растет экспоненциально, особенно при обработке контекста полной емкости. То, как Google установит цены и найдет баланс между производительностью и затратами, станет ключевым фактором, определяющим возможность массового внедрения этой функции.

Кроме того, само предположение «чем больше контекст, тем лучше» также требует проверки. Исследования показывают, что при чрезмерно большом окне контекста распределение внимания модели может стать неэффективным: она может «видеть» всю информацию, но не способна точно сфокусироваться на наиболее релевантных частях.

Основной релиз

Окно контекста на 2 миллиона токенов

По-настоящему нативная мультимодальность

Встроенное выполнение кода в песочнице

Хронология релизов Google

Конкурентный ландшафт

Скрытые риски

Похожие материалы

Самая большая ловушка при написании LLM кода для комбинаторной оптимизации: просишь оптимизировать — модель только всё портит

Чем детальнее оценочные критерии, тем больше модель находит лазейки: взлом системы вознаграждения в обучении с подкреплением на основе рубрик

RLHF тихонько разрушает «честность» ИИ: в чём суть Semantic Reward Collapse