Claude Mythos: обучение антисикофантии снижает нечестность до 1/4 от Opus 4.6, вероятность июньского релиза 30%

Что произошло

Флагманская модель Anthropic следующего поколения Claude Mythos продемонстрировала значительное улучшение способностей в последнем раунде внутреннего тестирования, особенно в области антисикофантического обучения. Одновременно отраслевой анализ оценивает вероятность выпуска Mythos до 30 июня примерно в 30%.

Антисикофантическое обучение: данные говорят сами за себя

Сикофантия ИИ — когда модели склонны соглашаться с пользователями, а не давать честные ответы — является одной из ключевых проблем больших языковых моделей сегодня. Anthropic систематически решает эту проблему через целевое обучение.

Данные тестирования

В реальных сценариях разговоров (вопросы рекомендательного характера, где ИИ склонен к сикофантическим ответам):

Модель	Уровень сикофантии	По сравнению с Opus 4.6
Opus 4.6	Базовый уровень	—
Opus 4.7	Снижение на 50%	Уменьшено вдвое
Mythos Preview	Ещё 50% снижения	Всего 1/4 от Opus 4.6

Это улучшение не ограничивается конкретными областями. Тестирование показывает, что антисикофантическое обучение обобщается на различные области — в обзоре кода, технических консультациях, оценке безопасности и многих других измерениях Mythos Preview демонстрирует более сильную готовность “говорить правду”.

Почему антисикофантия важна

Сикофантия особенно опасна в следующих сценариях:

Обзор кода: модели пропускают проблемный код, чтобы “угодить” разработчикам
Оценка безопасности: модели подтверждают предположения пользователей о безопасности, а не указывают на реальные уязвимости
Медицинские/юридические консультации: модели соглашаются с пользователями вместо предоставления осторожных рекомендаций
Инвестиционные решения: модели подстраиваются под предубеждения пользователей вместо объективного анализа

Когда ИИ используется как инструмент поддержки принятия решений, честность важнее дружелюбия.

Ценовая полемика: проблема стоимости Opus 4.7

До выхода Mythos ценообразование Opus 4.7 вызвало обсуждение в сообществе:

Множитель от Opus 4.6 к 4.7 увеличился с 3x до 27x — 9-кратное повышение цены на одну модель
Некоторые считают это “изменением категории”, а не простым “корректировкой цен”
Некоторые платформы заменяют старые модели на Opus 4.7, что вызывает вопросы о том, оправдывает ли улучшение производительности повышение цен

Это добавляет неопределённости в стратегию ценообразования Mythos: будет ли Anthropic продолжать премиальный путь или Mythos перезагрузит ценовую систему?

Прогноз сроков выпуска Mythos

Согласно отраслевому анализу (от модели прогнозирования @pmarca):

Сроки	Вероятность выпуска
Конец мая 2026	< 10%
До 30 июня 2026	~30%
Июль 2026	~50%
Конец Q3 2026	> 70%

Вероятность выпуска в июне 30% означает, что Anthropic может дать чёткие сигналы о выпуске в этом или следующем месяце.

Продуктовая матрица Anthropic 2026 года

Взгляд на продуктовую линейку Anthropic в 2026 году:

Продукт	Статус	Позиционирование
Opus 4.6	Выпущен	Предыдущий флагман
Opus 4.7	Выпущен	Текущий флагман (ценовая дискуссия)
Claude Design	Выпущен	Помощь в дизайне
Обновления Claude Code	Выпущены	Инструмент кодирования
Claude Mythos Preview	Тестирование	Превью флагмана следующего поколения
Claude Mythos	Ожидается	Следующий официальный флагман
Task Budgets Beta	Выпущен	Управление бюджетом задач
Высокое разрешение зрения	Выпущено	Улучшение зрительных возможностей

Позиционирование Mythos — не просто итерация Opus 4.7, а новый уровень способностей. Глубокие инвестиции в антисикофантическое обучение показывают, что Anthropic решает проблему “поведенческого выравнивания” больших моделей, а не просто гонится за баллами бенчмарков.

Конкурентный ландшафт

Против GPT-5.5

GPT-5.5 OpenAI (кодовое имя “Spud”) был выпущен в конце апреля, подтверждён ежемесячный ритм выпуска моделей. Преимущества GPT-5.5:

Более быстрый цикл выпуска
Более широкая интеграция экосистемы (ChatGPT Agents, Sora, Codex)
Более зрелая ценовая система

Дифференциация Mythos:

Более сильное поведенческое выравнивание (антисикофантия)
Более высокая честность
Более надёжен в сценариях, требующих “сказать нет”

Против Qwen 3.6 Max Preview

Qwen 3.6 Max Preview от Alibaba также был выпущен в конце апреля, со значительным прогрессом в кодировании, использовании инструментов и рабочих процессах Agent. Его ключевое преимущество — соотношение цены и качества — чрезвычайно конкурентоспособно на рынках, чувствительных к цене.

Что произошло

Антисикофантическое обучение: данные говорят сами за себя

Данные тестирования

Почему антисикофантия важна

Ценовая полемика: проблема стоимости Opus 4.7

Прогноз сроков выпуска Mythos

Продуктовая матрица Anthropic 2026 года

Конкурентный ландшафт

Против GPT-5.5

Против Qwen 3.6 Max Preview

Рекомендации к действию

Похожие материалы

Отчёт с поля: DeepSeek V4 Pro — производительность на уровне Claude Code при цене в 1/40, полный перевод рабочих процессов подтверждён

Стратегия Qwen 3.6: от локального развёртывания 27B до облачного Max — полный анализ матрицы

Zhipu GLM-5.1 выпущен: 600 итераций непрерывной оптимизации, новый отечественный выбор для долгосрочных задач агентов