Google только что выпустила Gemini 3.5 Flash. В заголовке нет ни параметров, ни бенчмарков. Там написано «agent-optimized».
Перевод: эта модель создана не для чата с вами. Она создана для многократных вызовов агентскими системами.
Агентам нужно от моделей совсем другое
Если вы использовали агентский фреймворк (LangChain, CrewAI или даже MCP от Claude), вы знаете, что вызовы модели агентом — это совсем не то же самое, что вызовы человеком:
- Короткие отдельные запросы, но огромный объём. Одна агентская задача может запустить десятки или сотни вызовов модели.
- Чувствительность к задержкам. Каждые дополнительные 200 мс на вызов накапливаются по цепочке, и вся задача зависает.
- Низкая толерантность к ошибкам. Неправильный формат вывода, неправильные параметры инструментов — весь пайплайн ломается.
- Чувствительность к стоимости. Цена 100 вызовов важнее цены одного вызова.
Gemini 3.5 Flash нацелена прямо на эти болевые точки.
Название «Flash» не случайно
У Gemini всегда было две линии: Pro (флагман, самый мощный) и Flash (лёгкая, быстрая, дешёвая).
3.5 Flash — очередная итерация. Google не поделилась конкретными цифрами производительности, но фокус ясен: сделать агентов доступными и плавными в работе.
Это соответствует общей AI-стратегии Google. У Google есть Search, Workspace, Android — всем нужны высокочастотные, низкобюджетные вызовы моделей. Flash создан для этих поверхностей.
Невыпущенная модель «Omni»
В том же объявлении упомянута модель под названием Omni, описанная как «do anything model».
Никаких деталей, никакой даты релиза, никаких бенчмарков. Но одного этого описания достаточно для спекуляций.
Мой взгляд: Omni, вероятно, ответ Google на GPT-5.5, всё ещё дорабатывается. Flash идёт первым, чтобы захватить агентский рынок. Флагман следует позже.
Сравнение с конкурентами
Запуски агентских моделей на этой неделе складываются:
- Qwen3.7-Max фокусируется на агентских способностях
- Anthropic приобретает Stainless для укрепления агентской цепочки инструментов
- Google выпускает Gemini 3.5 Flash, оптимизированную для агентской производительности
- GPT-5.5 от OpenAI также усиливает вызовы инструментов
Четыре пути, одно направление.
Разница: Qwen — open-source, Anthropic — full-stack closed, Google — сценарно-встроенная, OpenAI — платформенно-экосистемная.
Ландшафт агентской гонки на H1 2026 в основном очерчен.
Мой взгляд
Позиционирование Gemini 3.5 Flash умное. Оно не соревнуется с флагманскими моделями по предельным способностям. Оно соревнуется по «соотношению цена-качество для агентских сценариев».
Если ваша агентская система вызывает модель тысячи раз в день, разница в 100 мс и 50% разницы в цене — эти цифры напрямую отражаются в пользовательском опыте и операционном бюджете. Flash вырезает именно этот рынок.
Но стандарт оценки для агентских сценариев всё ещё отсутствует. Без признанного «агентского бенчмарка» «агентская оптимизация» каждой компании — это самоотчёт.
Когда кто-то создаст полноценный набор оценки агентских способностей, вот тогда эта гонка действительно созреет.
Основные источники: