Когда OpenAI выпустила GPT-5.5 23 апреля, она одновременно представила режим Codex Agent. Помимо программирования, самая примечательная особенность режима Agent GPT-5.5 — управление браузером и операциями с компьютером — ИИ может автономно навигировать по веб-страницам, управлять интерфейсами приложений и даже вести переговоры со службой поддержки.
Обзор возможностей агента
Ключевые способности GPT-5.5 Codex Agent:
- Управление браузером: С подпиской ChatGPT Pro+ и включённым computer use, агент может захватить браузер, автономно выполняя вход, навигацию, заполнение форм и другие операции
- Операции с компьютером: Прямое управление интерфейсами операционной системы без использования API или командной строки
- Принятие решений в реальном времени: При столкновении с всплывающими окнами, капчами или изменениями страниц во время операций агент может автономно оценивать ситуацию и корректировать стратегию
Реальные тестовые кейсы
В сообществе задокументировано несколько реальных случаев использования:
Отмена подписки и запрос возврата: Пользователь попросил агента «войти в Amazon, отменить подписку Prime и запросить возврат $15.89 за апрель». Агент автономно выполнил:
- Вошёл в аккаунт Amazon
- Перешёл на страницу управления подпиской
- Отменил подписку
- Открыл чат со службой поддержки
- Объяснил цикл выставления счетов и договорился о возврате
- Успешно получил возврат $15
Весь процесс был завершён за считанные минуты без вмешательства человека.
Генерация брендового фона для конференц-залов: На DevDay OpenAI представила проект BrandRoom, использующий Codex + GPT-5.5 и GPT Image 2 для автоматической генерации брендовых фонов для встреч, решая проблему фонов для видеоконференций удалённых команд.
Сравнение с Claude Code
В сценариях программирования с агентом некоторые пользователи сообщают, что прозрачность ценообразования Codex ниже, чем у Claude Code: инженерная команда из 16 человек рассматривала переход с Codex на Cursor, поскольку прозрачность использования токенов и ценообразования Cursor выше, а также поддерживает больше моделей, таких как Composer 2.
Тем не менее, способность Codex Agent управлять браузером в настоящее время лидирует — Claude Code в основном фокусируется на операциях внутри среды программирования, тогда как Codex может управлять браузерами и более широким спектром настольных приложений.
Интересный факт: системный промпт Goblin
В системный промпт Codex добавлено новое правило: запрещено упоминать гоблинов (goblins), грмлинов (gremlins), троллей (trolls) и других «существ», если они не относятся к задаче. Сообщество обнаружило, что GPT-5.5 ранее чрезмерно реагировал на слово «goblin» в Codex, что побудило OpenAI добавить явное правило запрета. Это отражает непредсказуемость моделей агентов в сложных взаимодействиях.
Рекомендации к действию
- Пользователям, нуждающимся в автоматизации браузера: Управление браузером GPT-5.5 Codex Agent — одно из самых зрелых решений на текущий момент. Подайте заявку на подписку Pro+ и включите computer use для тестирования
- Инженерным командам: Если ваша команда в основном использует агентов для программирования, а не автоматизации браузера, сравните стоимость токенов и прозрачность Codex vs. Cursor/Claude Code
- Вопросы безопасности: Агенты могут управлять браузерами и системными интерфейсами. Установите чёткие границы разрешений и операционные рамки в производственных средах
Основные источники
- OpenAI Codex
- OpenAI DevDay 2026
- Отчёты о тестировании сообщества (X/Twitter)