Gemini 3.1 Ultra: нативное мультимодальное контекстное окно на 2 миллиона токенов, Google I/O дразнит новой моделью Flash

Основной релиз

Google официально выпустила Gemini 3.1 Ultra, доведя контекстное окно до уровня 2 миллионов токенов с нативной мультимодальной поддержкой — текст, изображения, аудио и видео обрабатываются единообразно в одной модели, без необходимости комбинировать несколько моделей.

Сравнение ключевых показателей

Параметр	Gemini 3.1 Ultra	Gemini 3.0 Ultra	Claude Opus 4.6
Контекстное окно	2M токенов	1M токенов	1M токенов
Поддержка модальностей	Текст+Изображение+Аудио+Видео	Текст+Изображение+Аудио	Текст+Изображение
Мультимодальный метод	Нативная единая	Нативная единая	Комбинирование моделей
Дата выпуска	Май 2026	Февраль 2026	Апрель 2026

Что означает 2M контекста

2 миллиона токенов примерно равны:

1,5 миллиона английских слов или 1 миллиону китайских иероглифов
Техническая книга на 1500 страниц
Полный транскрипт фильма с описанием сцен
Всё содержимое кодовой базы на 1000 страниц

Обработка такого объёма данных в одном запросе вывода означает, что потребности в RAG (Retrieval-Augmented Generation) могут быть переопределены — когда контекстное окно достаточно велико, шаг «поиска» может стать ненужным.

Четырёхуровневая экосистема Gemini

Google выстраивает многоуровневую продуктовую стратегию:

Gemini Chat (бесплатный уровень): Повседневные вопросы и ответы, 3.1 Pro для сложных задач
Gemini Advanced (подписка): Разблокировка модели Ultra, 2M контекст
Gemini API (уровень разработчика): Оплата за использование, поддержка fine-tuning
Gemini Enterprise (корпоративный уровень): Варианты приватного развёртывания

Тем временем на LMSys Arena появились записи оценки новой модели Gemini Flash (возможно, версия 3.5). В сочетании с предстоящей конференцией Google I/O ожидаются значительные обновления продуктов.

Оценка конкурентного ландшафта

Гонка контекстных окон вступила в новую фазу:

Gemini 3.1 Ultra: 2M, лидер
Claude Opus 4.6: 1M, следует вплотную
GPT-5.5: 200K, значительный разрыв, но лидерство в агентных способностях
Qwen 3.6 Max: 262K, преимущество в соотношении цена/качество

Для большинства прикладных сценариев 262K-1M уже более чем достаточно. Ценность 2M проявляется преимущественно в сценариях однократной обработки сверхкрупных документов (юридические дела, медицинская литература, полные репозитории кода).

Основной релиз

Сравнение ключевых показателей

Что означает 2M контекста

Четырёхуровневая экосистема Gemini

Оценка конкурентного ландшафта

Рекомендации к действию

Похожие материалы

GPT-6 входит в фазу выравнивания безопасности: 5-6 триллионов параметров, математическое рассуждение 92,5%,通过率 кода 96,8%

MiniMax M3 выходит в этом месяце: нацелен на офисные сценарии с масштабным обновлением агентных способностей

GLM-5.1 выходит на 0G Private Computer: что значит запуск 754B MoE-модели внутри TEE