Anthropic выпускает BioMysteryBench: Claude Mythos решает 30% биоинформатических задач, не под силу экспертам

Anthropic выпускает BioMysteryBench: Claude Mythos решает 30% биоинформатических задач, не под силу экспертам

Ключевой вывод

29 апреля Anthropic открыла BioMysteryBench на Hugging Face — новый бенчмарк оценки биоинформатики. Бенчмарк содержит 99 открытых вопросов на основе реальных исследовательских данных. Из них 23 вопроса не смогли решить даже эксперты в данной области.

Claude Mythos решил примерно 30% этих «невозможных» вопросов и большинство остальных. Это знаменательный прорыв ИИ в научных исследованиях.

Рекомендации

  • Исследователи в области биоинформатики: BioMysteryBench доступен на Hugging Face для тестирования
  • Разработчики AI-приложений: Новая вертикальная возможность — инструменты научных ассистентов
  • Инвесторы: Anthropic ускоряет развитие в области научного ИИ