Предварительные утечки Google I/O: мультимодальная модель Gemini "Omni" + 3.5 Flash + новая модель зрения, тройной выпуск на разогреве

Ключевое решение

За несколько дней до Google I/O информация о продуктовой линейке Gemini активно просачивается. Ключевой сигнал: Google больше не满足于 быть «лучшим чат-ботом» — компания стремится создать ИИ-инфраструктуру полного спектра, охватывающую текст, видео и зрение.

Утечки касаются трёх продуктовых линеек, каждая из которых занимает свою рыночную позицию — это не просто обновление одной модели, а реструктуризация продуктовой матрицы на стратегическом уровне.

Три утечки продуктовых линеек

1. Мультимодальная модель Gemini “Omni”

Атрибут	Информация
Позиционирование	Сверхглубокое мультимодальное понимание и генерация
Ключевая способность	Превосходит текущее качество генерации видео Veo, поддерживает двустороннее понимание + генерацию видео
Текущий статус	Внутреннее тестирование, в UI уже появляется метка «powered by Omni»
Окно выпуска	Во время или вскоре после Google I/O

Ключевая ценность Omni заключается в объединении понимания и генерации. Текущие ИИ-модели обычно однонаправленны — они могут понимать видео, но не генерировать его, или генерировать, но не понимать. Если Omni реализует двустороннюю способность, она станет первой по-настоящему «всемодальной» моделью.

Утекшие скриншоты UI показывают метку «powered by Omni», что указывает на планы Google интегрировать её как底层 движок в несколько продуктов, а не как отдельный чат-интерфейс.

2. Gemini 3.5 Flash

Атрибут	Информация
Позиционирование	Высокоскоростная, недорогая модель для повседневных рассуждений
Текущий статус	Уже на внутреннем тестировании
Ожидаемый выпуск	Google I/O
Целевой конкурент	GPT-4o mini, Claude Haiku

3.5 Flash продолжает позиционирование серии «Flash» от Google — не стремление к сильнейшему интеллекту, а стремление к наивысшей скорости отклика и наименьшей стоимости. Для корпоративных пользователей, нуждающихся в масштабном развёртывании ИИ, это наиболее прагматичный выбор.

3. Модель зрения «spark Robin»

Атрибут	Информация
Позиционирование	Новая модель, сфокусированная на понимании изображений/зрения
Текущий статус	Этап утечки, ограниченная детализация
Возможное применение	Обновление Google Lens, умный поиск в Photos, зрение на уровне системы Android

Название «spark Robin» предполагает принадлежность к серии моделей «Spark» от Google (Muse Spark — флагман этой серии). Если это отдельная модель зрения, Google может интегрировать её в систему Android, реализовав зрение ИИ на системном уровне.

Потенциальная полная картина Google I/O 2026

Продукт	Позиционирование	Целевые пользователи
Gemini 3.5 Flash	Высокоскоростные недорогие рассуждения	Разработчики, корпоративное массовое развёртывание
Gemini Omni	Полномодальное понимание + генерация	Премиум-пользователи, креативные индустрии
spark Robin	Специализированная модель зрения	Мобильные устройства, системная интеграция
Daily Brief	ИИ-ежедневная сводка	Индивидуальные пользователи
Cosmo AI (Nano)	Приложение ИИ на устройстве	Мобильные устройства
AI Avatars	Цифровые люди	Социальные сети, сценарии обслуживания клиентов

Сравнение конкурентного ландшафта

Компания	Мультимодальная стратегия	Текущая сильнейшая
Google	Omni объединяет понимание + генерацию	Gemini 2.5 Pro
OpenAI	GPT-4o мультимодальная + Veo видео	GPT-5.5
Anthropic	Claude нативная мультимодальная	Claude 5 (Mythos)
Alibaba	Qwen-VL + Tongyi Wanxiang	Qwen3.6-Max

Стратегия Omni от Google наиболее схожа с GPT-4o от OpenAI — обе стремятся к одной модели, обрабатывающей все модальности. Но в отличие от подхода OpenAI с «одной сверхбольшой моделью», Google выбрала стратегию матрицы нескольких моделей: Flash для объёма, Omni для тяжёлых задач, Robin для специализации. Преимущество этой стратегии — гибкость и контроль затрат; недостаток — более высокая сложность интеграции экосистемы.

Предупреждение о рисках

Вся текущая информация основана на утечках и не подтверждена официально. Фактическое содержание выпуска Google I/O может отличаться от утечек. Исторически Google также leaking多条信息 перед I/O, которые так и не материализовались. Ожидайте официальных объявлений.

Предварительные утечки Google I/O: мультимодальная модель Gemini "Omni" + 3.5 Flash + новая модель зрения, тройной выпуск на разогреве

Ключевое решение

Три утечки продуктовых линеек

1. Мультимодальная модель Gemini “Omni”

2. Gemini 3.5 Flash

3. Модель зрения «spark Robin»

Потенциальная полная картина Google I/O 2026

Сравнение конкурентного ландшафта

Рекомендации к действию

Для разработчиков

Для предприятий

Предупреждение о рисках

Ключевое решение

Три утечки продуктовых линеек

1. Мультимодальная модель Gemini “Omni”

2. Gemini 3.5 Flash

3. Модель зрения «spark Robin»

Потенциальная полная картина Google I/O 2026

Сравнение конкурентного ландшафта

Рекомендации к действию

Для разработчиков

Для предприятий

Предупреждение о рисках

Похожие материалы

GPT-6 входит в фазу выравнивания безопасности: 5-6 триллионов параметров, математическое рассуждение 92,5%,通过率 кода 96,8%

MiniMax M3 выходит в этом месяце: нацелен на офисные сценарии с масштабным обновлением агентных способностей

GLM-5.1 выходит на 0G Private Computer: что значит запуск 754B MoE-модели внутри TEE