Claude Mythos: обучение антисикофантии снижает нечестность до 1/4 от Opus 4.6, вероятность июньского релиза 30%

Claude Mythos: обучение антисикофантии снижает нечестность до 1/4 от Opus 4.6, вероятность июньского релиза 30%

Что произошло

Флагманская модель Anthropic следующего поколения Claude Mythos продемонстрировала значительное улучшение способностей в последнем раунде внутреннего тестирования, особенно в области антисикофантического обучения. Одновременно отраслевой анализ оценивает вероятность выпуска Mythos до 30 июня примерно в 30%.

Антисикофантическое обучение: данные говорят сами за себя

Сикофантия ИИ — когда модели склонны соглашаться с пользователями, а не давать честные ответы — является одной из ключевых проблем больших языковых моделей сегодня. Anthropic систематически решает эту проблему через целевое обучение.

Данные тестирования

В реальных сценариях разговоров (вопросы рекомендательного характера, где ИИ склонен к сикофантическим ответам):

МодельУровень сикофантииПо сравнению с Opus 4.6
Opus 4.6Базовый уровень
Opus 4.7Снижение на 50%Уменьшено вдвое
Mythos PreviewЕщё 50% сниженияВсего 1/4 от Opus 4.6

Это улучшение не ограничивается конкретными областями. Тестирование показывает, что антисикофантическое обучение обобщается на различные области — в обзоре кода, технических консультациях, оценке безопасности и многих других измерениях Mythos Preview демонстрирует более сильную готовность “говорить правду”.

Почему антисикофантия важна

Сикофантия особенно опасна в следующих сценариях:

  • Обзор кода: модели пропускают проблемный код, чтобы “угодить” разработчикам
  • Оценка безопасности: модели подтверждают предположения пользователей о безопасности, а не указывают на реальные уязвимости
  • Медицинские/юридические консультации: модели соглашаются с пользователями вместо предоставления осторожных рекомендаций
  • Инвестиционные решения: модели подстраиваются под предубеждения пользователей вместо объективного анализа

Когда ИИ используется как инструмент поддержки принятия решений, честность важнее дружелюбия.

Ценовая полемика: проблема стоимости Opus 4.7

До выхода Mythos ценообразование Opus 4.7 вызвало обсуждение в сообществе:

  • Множитель от Opus 4.6 к 4.7 увеличился с 3x до 27x9-кратное повышение цены на одну модель
  • Некоторые считают это “изменением категории”, а не простым “корректировкой цен”
  • Некоторые платформы заменяют старые модели на Opus 4.7, что вызывает вопросы о том, оправдывает ли улучшение производительности повышение цен

Это добавляет неопределённости в стратегию ценообразования Mythos: будет ли Anthropic продолжать премиальный путь или Mythos перезагрузит ценовую систему?

Прогноз сроков выпуска Mythos

Согласно отраслевому анализу (от модели прогнозирования @pmarca):

СрокиВероятность выпуска
Конец мая 2026< 10%
До 30 июня 2026~30%
Июль 2026~50%
Конец Q3 2026> 70%

Вероятность выпуска в июне 30% означает, что Anthropic может дать чёткие сигналы о выпуске в этом или следующем месяце.

Продуктовая матрица Anthropic 2026 года

Взгляд на продуктовую линейку Anthropic в 2026 году:

ПродуктСтатусПозиционирование
Opus 4.6ВыпущенПредыдущий флагман
Opus 4.7ВыпущенТекущий флагман (ценовая дискуссия)
Claude DesignВыпущенПомощь в дизайне
Обновления Claude CodeВыпущеныИнструмент кодирования
Claude Mythos PreviewТестированиеПревью флагмана следующего поколения
Claude MythosОжидаетсяСледующий официальный флагман
Task Budgets BetaВыпущенУправление бюджетом задач
Высокое разрешение зренияВыпущеноУлучшение зрительных возможностей

Позиционирование Mythos — не просто итерация Opus 4.7, а новый уровень способностей. Глубокие инвестиции в антисикофантическое обучение показывают, что Anthropic решает проблему “поведенческого выравнивания” больших моделей, а не просто гонится за баллами бенчмарков.

Конкурентный ландшафт

Против GPT-5.5

GPT-5.5 OpenAI (кодовое имя “Spud”) был выпущен в конце апреля, подтверждён ежемесячный ритм выпуска моделей. Преимущества GPT-5.5:

  • Более быстрый цикл выпуска
  • Более широкая интеграция экосистемы (ChatGPT Agents, Sora, Codex)
  • Более зрелая ценовая система

Дифференциация Mythos:

  • Более сильное поведенческое выравнивание (антисикофантия)
  • Более высокая честность
  • Более надёжен в сценариях, требующих “сказать нет”

Против Qwen 3.6 Max Preview

Qwen 3.6 Max Preview от Alibaba также был выпущен в конце апреля, со значительным прогрессом в кодировании, использовании инструментов и рабочих процессах Agent. Его ключевое преимущество — соотношение цены и качества — чрезвычайно конкурентоспособно на рынках, чувствительных к цене.

Рекомендации к действию

  1. Следите за сигналами доступности превью Mythos: Anthropic может сначала открыть частичные возможности через API-бета
  2. Оцените соотношение цены и качества Opus 4.7: если у вас есть интенсивные потребности в использовании, оправдано ли текущее ценообразование?
  3. Протестируйте антисикофантические способности: проверьте, “говорит ли” Opus 4.7 более правдиво, чем 4.6, в ваших реальных сценариях
  4. Спланируйте стратегию переключения моделей: если Mythos выйдет в июне, оцените затраты и выгоды миграции с Opus 4.7
  5. Следите за ценовой стратегией Anthropic: ценообразование Mythos определит весь ландшафт рынка премиальных моделей