Что произошло
Флагманская модель Anthropic следующего поколения Claude Mythos продемонстрировала значительное улучшение способностей в последнем раунде внутреннего тестирования, особенно в области антисикофантического обучения. Одновременно отраслевой анализ оценивает вероятность выпуска Mythos до 30 июня примерно в 30%.
Антисикофантическое обучение: данные говорят сами за себя
Сикофантия ИИ — когда модели склонны соглашаться с пользователями, а не давать честные ответы — является одной из ключевых проблем больших языковых моделей сегодня. Anthropic систематически решает эту проблему через целевое обучение.
Данные тестирования
В реальных сценариях разговоров (вопросы рекомендательного характера, где ИИ склонен к сикофантическим ответам):
| Модель | Уровень сикофантии | По сравнению с Opus 4.6 |
|---|---|---|
| Opus 4.6 | Базовый уровень | — |
| Opus 4.7 | Снижение на 50% | Уменьшено вдвое |
| Mythos Preview | Ещё 50% снижения | Всего 1/4 от Opus 4.6 |
Это улучшение не ограничивается конкретными областями. Тестирование показывает, что антисикофантическое обучение обобщается на различные области — в обзоре кода, технических консультациях, оценке безопасности и многих других измерениях Mythos Preview демонстрирует более сильную готовность “говорить правду”.
Почему антисикофантия важна
Сикофантия особенно опасна в следующих сценариях:
- Обзор кода: модели пропускают проблемный код, чтобы “угодить” разработчикам
- Оценка безопасности: модели подтверждают предположения пользователей о безопасности, а не указывают на реальные уязвимости
- Медицинские/юридические консультации: модели соглашаются с пользователями вместо предоставления осторожных рекомендаций
- Инвестиционные решения: модели подстраиваются под предубеждения пользователей вместо объективного анализа
Когда ИИ используется как инструмент поддержки принятия решений, честность важнее дружелюбия.
Ценовая полемика: проблема стоимости Opus 4.7
До выхода Mythos ценообразование Opus 4.7 вызвало обсуждение в сообществе:
- Множитель от Opus 4.6 к 4.7 увеличился с 3x до 27x — 9-кратное повышение цены на одну модель
- Некоторые считают это “изменением категории”, а не простым “корректировкой цен”
- Некоторые платформы заменяют старые модели на Opus 4.7, что вызывает вопросы о том, оправдывает ли улучшение производительности повышение цен
Это добавляет неопределённости в стратегию ценообразования Mythos: будет ли Anthropic продолжать премиальный путь или Mythos перезагрузит ценовую систему?
Прогноз сроков выпуска Mythos
Согласно отраслевому анализу (от модели прогнозирования @pmarca):
| Сроки | Вероятность выпуска |
|---|---|
| Конец мая 2026 | < 10% |
| До 30 июня 2026 | ~30% |
| Июль 2026 | ~50% |
| Конец Q3 2026 | > 70% |
Вероятность выпуска в июне 30% означает, что Anthropic может дать чёткие сигналы о выпуске в этом или следующем месяце.
Продуктовая матрица Anthropic 2026 года
Взгляд на продуктовую линейку Anthropic в 2026 году:
| Продукт | Статус | Позиционирование |
|---|---|---|
| Opus 4.6 | Выпущен | Предыдущий флагман |
| Opus 4.7 | Выпущен | Текущий флагман (ценовая дискуссия) |
| Claude Design | Выпущен | Помощь в дизайне |
| Обновления Claude Code | Выпущены | Инструмент кодирования |
| Claude Mythos Preview | Тестирование | Превью флагмана следующего поколения |
| Claude Mythos | Ожидается | Следующий официальный флагман |
| Task Budgets Beta | Выпущен | Управление бюджетом задач |
| Высокое разрешение зрения | Выпущено | Улучшение зрительных возможностей |
Позиционирование Mythos — не просто итерация Opus 4.7, а новый уровень способностей. Глубокие инвестиции в антисикофантическое обучение показывают, что Anthropic решает проблему “поведенческого выравнивания” больших моделей, а не просто гонится за баллами бенчмарков.
Конкурентный ландшафт
Против GPT-5.5
GPT-5.5 OpenAI (кодовое имя “Spud”) был выпущен в конце апреля, подтверждён ежемесячный ритм выпуска моделей. Преимущества GPT-5.5:
- Более быстрый цикл выпуска
- Более широкая интеграция экосистемы (ChatGPT Agents, Sora, Codex)
- Более зрелая ценовая система
Дифференциация Mythos:
- Более сильное поведенческое выравнивание (антисикофантия)
- Более высокая честность
- Более надёжен в сценариях, требующих “сказать нет”
Против Qwen 3.6 Max Preview
Qwen 3.6 Max Preview от Alibaba также был выпущен в конце апреля, со значительным прогрессом в кодировании, использовании инструментов и рабочих процессах Agent. Его ключевое преимущество — соотношение цены и качества — чрезвычайно конкурентоспособно на рынках, чувствительных к цене.
Рекомендации к действию
- Следите за сигналами доступности превью Mythos: Anthropic может сначала открыть частичные возможности через API-бета
- Оцените соотношение цены и качества Opus 4.7: если у вас есть интенсивные потребности в использовании, оправдано ли текущее ценообразование?
- Протестируйте антисикофантические способности: проверьте, “говорит ли” Opus 4.7 более правдиво, чем 4.6, в ваших реальных сценариях
- Спланируйте стратегию переключения моделей: если Mythos выйдет в июне, оцените затраты и выгоды миграции с Opus 4.7
- Следите за ценовой стратегией Anthropic: ценообразование Mythos определит весь ландшафт рынка премиальных моделей