Имя Тимоти Гауэрса в математическом сообществе не нуждается в представлении. Лауреат Филдсовской медали 1998 года, профессор Кембриджа. Одного его поста в блоге достаточно, чтобы весь математический мир остановился и посмотрел.
8 мая он опубликовал развёрнутый пост в своём блоге с обманчиво простым заголовком: «Недавний опыт работы с ChatGPT 5.5 Pro». Содержание незамысловатое: он использовал ChatGPT 5.5 Pro для проведения исследования на уровне докторской диссертации в области аддитивной теории чисел, не внося существенного математического вклада самостоятельно, и модель выдала результаты, достойные публикации, примерно за час.
Он не выбрал лёгкую задачу
Гауэрс выбрал не задачи из списка Эрдёша, где сообщество уже обсуждало, способны ли LLM их решить. Он взял открытые вопросы из статьи Мела Натансона. У этих вопросов есть определённая особенность: автор их сформулировал, но из-за sheer объёма не успел глубоко обдумать каждый, что естественным образом оставляет место для подзадач, которые могут быть не слишком сложными, но пока не решены.
Исторически такие вопросы идеально подходили для математиков, начинающих исследовательскую карьеру. Решение официально «открытой» задачи — огромное ободрение для молодого учёного. Гауэрс написал:
«Ранее такие статьи были ценны как источники задач. Но планка только что поднялась. Уже недостаточно того, что кто-то поставил задачу: она должна быть достаточно сложной, чтобы LLM не смогла её решить.»
Это весомые слова. Это не расплывчатые рассуждения о том, что «LLM помогают в математических исследованиях». Это практикующий математик, признающий, что его критерии отбора задач должны измениться из-за модели.
Что именно сделал ChatGPT 5.5 Pro
Из описания Гауэрса видно несколько примечательных особенностей поведения модели:
Во-первых, это не было простым «поиском» известных результатов в литературе. Гауэрс прямо отметил, что ранние решения LLM часто сводились к тому, что модель замечала — ответ уже есть в опубликованных работах. В этот раз было иначе: в результатах появились цепочки рассуждений, которые математики-люди могли упустить.
Во-вторых, скорость. Около часа. Сама по себе скорость — сигнал. Не в том смысле, что люди так не могут, а в том, что не-математик, с нулевым математическим вводом, может продвинуть задачу уровня докторской за один час.
Почему это важно
410 баллов и 244 комментария на Hacker News показывают, что сообщество обратило внимание. Но в комментариях также проявляется ключевое разногласие: считается ли математика, выданная LLM, «оригинальной»?
Кто-то утверждает, что если каждый шаг аргументации имеет прецеденты в существующей литературе, LLM просто «комбинирует» имеющиеся знания. Ответ самого Гауэрса прагматичен: «Довольно много вполне качественной человеческой математики состоит именно в комбинировании существующих знаний и техник доказательств.»
Это заземлённая позиция. Граница между «оригинальностью» и «комбинацией» в математических исследованиях всегда была размытой. Если способности LLM к комбинированию достигли уровня, на котором они выдают результаты докторского уровня, спорить о том, «действительно ли это оригинально», менее полезно, чем выяснять, что модель может и чего не может.
Пока не замена людям
Гауэрс также обозначил границы. Для задач, требующих совершенно новых подходов без прецедентов, LLM ещё не доросли. Его тест был сосредоточен на задачах, где «может существовать простое рассуждение, которое математики по какой-то причине упустили» — а это как раз та область, где LLM сильны.
Так что не спешите заменять аспирантов-математиков API-ключами. Но сам сигнал — Филдсовский лауреат признаёт, что критерии отбора задач нужно менять из-за LLM — уже говорит о том, что кое-что меняется.
Основные источники: