GPT-5.5 Instant запущен: OpenAI сокращает галлюцинации вдвое, ChatGPT наконец учится молчать

Что произошло

Начиная с 5 мая OpenAI начала развёртывание GPT-5.5 Instant для всех пользователей ChatGPT, официально заменив предыдущую GPT-5.3 в качестве базовой модели по умолчанию. Сэм Альтман лично объявил об этом обновлении.

Это не мелкое обновление — судя по данным, GPT-5.5 Instant достигает значительных прорывов по нескольким параметрам.

Сравнение ключевых данных

Метрика	GPT-5.3	GPT-5.5 Instant	Изменение
Уровень галлюцинаций (медицина/право/финансы)	Базовый	-52,5%	Значительное снижение
Уровень ошибок, отмеченных пользователями	Базовый	-37,3%	Существенное улучшение
Количество слов в ответе (тот же запрос)	Базовый	-30,2%	Более лаконично
Количество строк в ответе (тот же запрос)	Базовый	-29,2%	Менее многословно
Точность ответов на STEM-вопросы	Базовый	Улучшена	Конкретные цифры не раскрыты

Почему это важно

Во-первых, значение сокращения галлюцинаций вдвое. В медицине, юриспруденции и финансах — трёх областях, где «ошибка имеет серьёзные последствия» — снижение уровня галлюцинаций более чем на 52,5% означает, что GPT-5.5 Instant начинает достигать уровня достоверности, необходимого для прямого использования в продакшене. Самым большим опасением предприятий при использовании ChatGPT было «не станет ли он выдумывать информацию?» — этот разрыв стремительно сокращается.

Во-вторых, снижение ошибок, управляемое пользовательскими отзывами. OpenAI особо отметила, что в «помеченных пользователями некорректных диалогах» уровень ошибок снизился на 37,3%, что свидетельствует о создании эффективной петли обратной связи: пользователи исправляют → модель обучается → аналогичные ошибки уменьшаются. Если этот механизм будет продолжать работать, темпы повышения качества серии GPT будут только ускоряться.

В-третьих, сдвиг философии продукта в сторону «умения замолчать». Хронической проблемой прошлых версий GPT были излишне развёрнутые ответы — нередко 500 слов использовались там, где хватило бы 100. Сокращение количества слов и строк примерно на 30% показывает, что OpenAI специально оптимизировала модель в направлении «лаконичности». Для разговорного продукта, обрабатывающего сотни миллионов запросов ежедневно, это напрямую означает более низкую задержку и лучший пользовательский опыт.

Технические предположения

Согласно анализу сообщества, если GPT-5.5 Instant разделяет ту же базовую модель, что и GPT-5.5 Thinking, то как минимум одно из следующих условий должно быть истинным:

Размер модели управляем: базовая модель не находится на уровне триллионов параметров (вероятно, в диапазоне 1-3T), иначе стоимость вывода по пути Instant была бы неподъёмной
Оптимизация маршрутизации: путь Instant использует обширную маршрутизацию, ограничения и стратегии кэширования, чтобы избежать полной цепочки рассуждений
Расширение инфраструктуры вывода: OpenAI значительно увеличила вычислительные мощности для вывода за последние месяцы

Учитывая, что путь Instant установлен как «по умолчанию» и бесплатен для всех пользователей, наиболее вероятны пункты 2 и 3 — OpenAI не стала бы развёртывать неоптимизированную модель напрямую для сотен миллионов пользователей.

Одновременный запуск: ChatGPT Ads Manager

Параллельно с обновлением модели OpenAI запустила бета-версию ChatGPT Ads Manager для самостоятельной рекламы в США:

Рекламодатели могут самостоятельно создавать и управлять поисковой рекламой
Добавлена новая модель ставок CPC (оплата за клик)
Интеграция со сторонними рекламными технологическими платформами, включая Pacvue, Kargo и StackAdapt
API конверсий скоро будет доступен

Это знаменует официальный вход OpenAI на рекламный рынок, при этом поисковый трафик ChatGPT начинает монетизироваться. Для брендов, уже запускающих кампании в Google Ads и Bing Ads, появился новый канал, за которым стоит следить.

Сценарий	Рекомендация
Ежедневное использование ChatGPT	Попробуйте GPT-5.5 Instant напрямую — ответы точнее и лаконичнее
Профессиональные области (медицина/право/финансы)	Подходит для первичного поиска и создания черновиков, но критические решения всё ещё требуют проверки человеком
Реклама	Отслеживайте прогресс бета-версии Ads Manager в США, оцените целесообразность интеграции
Сравнение с конкурентами	Проведите параллельные тесты с Claude Sonnet 4.6, Gemini 2.5 Pro для выбора оптимального варианта

Что произошло

Сравнение ключевых данных

Почему это важно

Технические предположения

Одновременный запуск: ChatGPT Ads Manager

Рекомендации к действию

Похожие материалы

Самая большая ловушка при написании LLM кода для комбинаторной оптимизации: просишь оптимизировать — модель только всё портит

Чем детальнее оценочные критерии, тем больше модель находит лазейки: взлом системы вознаграждения в обучении с подкреплением на основе рубрик

RLHF тихонько разрушает «честность» ИИ: в чём суть Semantic Reward Collapse