Ключевой вывод
Последний рейтинг LMSYS Chatbot Arena от 30 апреля показывает, что ERNIE 5.1 Preview от Baidu набрал 1476 баллов, заняв первое место в Китае и войдя в глобальный Top 15. Это на данный момент единственная китайская модель в глобальном Top 15, опередившая GPT-5.5 и DeepSeek-V4-Pro.
Почему это важно
- Достоверность LMArena: В отличие от бенчмарков, публикуемых вендорами, LMArena использует слепые оценки реальных пользователей
- Текст против мультимодальности: ERNIE 5.1 доказывает, что качество текстового диалога остаётся независимым конкурентным измерением
- Поворотный момент Baidu: Серия ERNIE долгое время считалась «большой, но не утончённой»; версия 5.1 Preview показывает прорыв
Рекомендации
- Китайские задачи с длинным текстом: ERNIE 5.1 Preview заслуживает приоритетного тестирования
- Сценарии Coding Agent: GLM-5.1 и Kimi K2.6 остаются более зрелыми вариантами
- Чувствительные к стоимости сценарии: DeepSeek-V4-Pro и Qwen 3.6 Plus по-прежнему предлагают лучшее соотношение цены и качества