C
ChaoBro

Предварительные утечки Google I/O: мультимодальная модель Gemini "Omni" + 3.5 Flash + новая модель зрения, тройной выпуск на разогреве

Предварительные утечки Google I/O: мультимодальная модель Gemini "Omni" + 3.5 Flash + новая модель зрения, тройной выпуск на разогреве

Ключевое решение

За несколько дней до Google I/O информация о продуктовой линейке Gemini активно просачивается. Ключевой сигнал: Google больше не满足于 быть «лучшим чат-ботом» — компания стремится создать ИИ-инфраструктуру полного спектра, охватывающую текст, видео и зрение.

Утечки касаются трёх продуктовых линеек, каждая из которых занимает свою рыночную позицию — это не просто обновление одной модели, а реструктуризация продуктовой матрицы на стратегическом уровне.

Три утечки продуктовых линеек

1. Мультимодальная модель Gemini “Omni”

АтрибутИнформация
ПозиционированиеСверхглубокое мультимодальное понимание и генерация
Ключевая способностьПревосходит текущее качество генерации видео Veo, поддерживает двустороннее понимание + генерацию видео
Текущий статусВнутреннее тестирование, в UI уже появляется метка «powered by Omni»
Окно выпускаВо время или вскоре после Google I/O

Ключевая ценность Omni заключается в объединении понимания и генерации. Текущие ИИ-модели обычно однонаправленны — они могут понимать видео, но не генерировать его, или генерировать, но не понимать. Если Omni реализует двустороннюю способность, она станет первой по-настоящему «всемодальной» моделью.

Утекшие скриншоты UI показывают метку «powered by Omni», что указывает на планы Google интегрировать её как底层 движок в несколько продуктов, а не как отдельный чат-интерфейс.

2. Gemini 3.5 Flash

АтрибутИнформация
ПозиционированиеВысокоскоростная, недорогая модель для повседневных рассуждений
Текущий статусУже на внутреннем тестировании
Ожидаемый выпускGoogle I/O
Целевой конкурентGPT-4o mini, Claude Haiku

3.5 Flash продолжает позиционирование серии «Flash» от Google — не стремление к сильнейшему интеллекту, а стремление к наивысшей скорости отклика и наименьшей стоимости. Для корпоративных пользователей, нуждающихся в масштабном развёртывании ИИ, это наиболее прагматичный выбор.

3. Модель зрения «spark Robin»

АтрибутИнформация
ПозиционированиеНовая модель, сфокусированная на понимании изображений/зрения
Текущий статусЭтап утечки, ограниченная детализация
Возможное применениеОбновление Google Lens, умный поиск в Photos, зрение на уровне системы Android

Название «spark Robin» предполагает принадлежность к серии моделей «Spark» от Google (Muse Spark — флагман этой серии). Если это отдельная модель зрения, Google может интегрировать её в систему Android, реализовав зрение ИИ на системном уровне.

Потенциальная полная картина Google I/O 2026

ПродуктПозиционированиеЦелевые пользователи
Gemini 3.5 FlashВысокоскоростные недорогие рассужденияРазработчики, корпоративное массовое развёртывание
Gemini OmniПолномодальное понимание + генерацияПремиум-пользователи, креативные индустрии
spark RobinСпециализированная модель зренияМобильные устройства, системная интеграция
Daily BriefИИ-ежедневная сводкаИндивидуальные пользователи
Cosmo AI (Nano)Приложение ИИ на устройствеМобильные устройства
AI AvatarsЦифровые людиСоциальные сети, сценарии обслуживания клиентов

Сравнение конкурентного ландшафта

КомпанияМультимодальная стратегияТекущая сильнейшая
GoogleOmni объединяет понимание + генерациюGemini 2.5 Pro
OpenAIGPT-4o мультимодальная + Veo видеоGPT-5.5
AnthropicClaude нативная мультимодальнаяClaude 5 (Mythos)
AlibabaQwen-VL + Tongyi WanxiangQwen3.6-Max

Стратегия Omni от Google наиболее схожа с GPT-4o от OpenAI — обе стремятся к одной модели, обрабатывающей все модальности. Но в отличие от подхода OpenAI с «одной сверхбольшой моделью», Google выбрала стратегию матрицы нескольких моделей: Flash для объёма, Omni для тяжёлых задач, Robin для специализации. Преимущество этой стратегии — гибкость и контроль затрат; недостаток — более высокая сложность интеграции экосистемы.

Рекомендации к действию

Для разработчиков

  • Следите за ценообразованием API Flash 3.5: Если она延续ит стратегию низких цен серии Flash, это может стать лучшим выбором для массового развёртывания
  • Оцените видео-способности Omni: Если генерация видео уровня Veo будет доступна через API, это drastically снизит порог создания видеоконтента
  • Подготовьте маршрутизацию нескольких моделей: Матрица нескольких моделей от Google означает, что вам понадобятся умные стратегии маршрутизации для выбора правильной модели

Для предприятий

  • Пользователи экосистемы Google получают приоритет: Компании, уже использующие Google Workspace, первыми体验到 глубокую интеграцию Gemini
  • Производители видеоконтента: Способность генерации видео Omni может изменить рабочие процессы создания видеоконтента
  • Мобильные разработчики: Возможности Cosmo AI (Nano) на устройстве值得 внимания, особенно для сценариев, чувствительных к конфиденциальности

Предупреждение о рисках

Вся текущая информация основана на утечках и не подтверждена официально. Фактическое содержание выпуска Google I/O может отличаться от утечек. Исторически Google также leaking多条信息 перед I/O, которые так и не материализовались. Ожидайте официальных объявлений.