ИИ покорил математику за два года
Авторы: Alex Wilkins
В марте 2025 года математик Дэниел Литт из Университета Торонто заключил пари. Он поставил на то, что вероятность написания ИИ математической статьи уровня лучших человеческих работ к 2030 году составляет не более 25%. Прошёл один год. В феврале 2026-го Литт написал в блоге: «Я ожидаю, что проиграю это пари».
За двенадцать месяцев случилось то, чего математическое сообщество не ожидало ещё лет десять. Машина, которая не справлялась со школьной алгеброй, взяла золото на Международной математической олимпиаде — самом престижном состязании для молодых математиков на планете.
Пари, которое рухнуло за год
«Пару лет назад они были бесполезны даже для решения задач из старших классов, а теперь иногда решают задачи, которые реально встречаются в исследовательской жизни математика», — сказал Литт в интервью New Scientist. Его удивление разделяет значительная часть академического сообщества.
Математика считалась последним бастионом. Шахматы пали в 1997-м, Go — в 2016-м, белковые структуры — в 2020-м. Но доказательство теорем — это не перебор ходов и не подбор конформаций. Это творчество. Элегантность. Интуиция, которую сами математики не могут объяснить словами. И именно здесь ИИ совершил скачок, который не укладывается в линейную экстраполяцию.
Серебро, потом золото: хроника двух лет
В июле 2024 года Google DeepMind представил AlphaProof — систему, обученную на 80 миллионах формальных математических утверждений в среде Lean.
Lean — язык формальной верификации, где каждый шаг доказательства проверяется машиной. Если доказательство компилируется — оно гарантированно корректно.
AlphaProof решил 4 из 6 задач Международной математической олимпиады 2024 года, включая самую сложную — задачу номер 6, с которой справились лишь несколько десятков участников из тысяч. Вместе с AlphaGeometry 2, специализирующейся на геометрии, система набрала баллы на уровне серебряной медали. Результат опубликовали в Nature.
Геометрический модуль оказался ещё убедительнее в ретроспективных тестах. AlphaGeometry 2 решила 84% всех геометрических задач IMO за период 2000–2024 годов — это превосходит средний результат золотых медалистов в этой дисциплине.
Полгода спустя OpenAI представила собственную систему, которая взяла золотую медаль на IMO 2025. А в начале 2026-го NVIDIA выпустила Nemotron-Cascade 2: модель с 30 миллиардами параметров (из которых активны только 3 миллиарда), которая получила золото сразу на трёх олимпиадах — IMO, IOI (информатика) и финалах ICPC (командное программирование). При этом модель в 20 раз компактнее, чем DeepSeek.
За два года — от провала школьной математики до тройного золота на мировых олимпиадах.
Как машина доказывает теоремы
AlphaProof работает по принципу, который одновременно прост и контринтуитивен. Система не «понимает» математику в человеческом смысле. Она играет в игру.
Reinforcement learning (обучение с подкреплением) — метод, при котором агент учится через пробы и ошибки, получая награду за правильные шаги. Так AlphaGo научился играть в Go, а AlphaProof — доказывать теоремы.
Каждое доказательство формулируется как последовательность ходов в языке Lean. Каждый ход — это применение леммы, подстановка, индукция. Lean проверяет каждый шаг мгновенно: либо он логически корректен, либо нет. Задача системы — найти такую последовательность ходов, которая приведёт от аксиом к целевому утверждению.
Это порождает замкнутый цикл: ИИ предлагает доказательство, Lean его верифицирует, результат используется для обучения. Не нужен человек-рецензент. Не нужен экспертный набор данных. Система буквально обучает себя сама, играя в «шахматы доказательств» миллионы партий.
AlphaEvolve пошёл дальше. Эта система от DeepMind, разработанная в сотрудничестве с лауреатом Филдсовской премии Теренсом Тао, использует эволюционный подход: генерирует математические конструкции, оценивает их, мутирует лучшие, повторяет. На 67 задачах из анализа, комбинаторики и теории чисел система воспроизвела лучшие известные решения в 75% случаев, а в ряде задач превзошла их.
Соавтор, а не замена
Панические заголовки «ИИ заменит математиков» не соответствуют реальности. Но и делать вид, что ничего не изменилось, тоже не получится.
Теренс Тао — один из самых влиятельных математиков современности — ещё в 2023 году предсказал, что ИИ уровня 2026 года станет «надёжным соавтором в математических исследованиях». Его прогноз сбывается: работа с AlphaEvolve показала, что система генерирует полезные конструкции, которые математик затем направляет и интерпретирует.
Кевин Баззард, профессор Имперского колледжа и евангелист формальной верификации, видит в связке «ИИ + Lean» новое разделение труда. Машина берёт на себя формализацию — утомительный перевод идеи в строгое доказательство. Человек сосредотачивается на том, что пока остаётся недоступным для алгоритмов: выбор направления, формулировка гипотезы, интуиция о том, какая задача вообще интересна.
Самый неожиданный эффект — демократизация. Любители, не имеющие степени по математике, начали решать задачи, которые профессионалы не могли закрыть десятилетиями. ИИ компенсирует разрыв в технической подготовке: генерирует формальные шаги, пока человек задаёт направление. Это как калькулятор для арифметики — только на уровне олимпиадных теорем.
Где машина всё ещё буксует
Восторг стоит сдерживать конкретикой. AlphaProof решил 4 из 6 задач IMO 2024, но две оставшиеся не поддались. Комбинаторные задачи — те, где нужно изобрести конструкцию, а не проверить утверждение — остаются слабым местом всех текущих систем.
Глубинная проблема в том, что reinforcement learning требует чёткого сигнала правильности. Lean даёт такой сигнал для доказательств: компилируется или нет. Но «придумать красивую гипотезу» — задача, у которой нет объективной функции потерь. Машина превосходно доказывает то, что ей сказали доказать. Но сказать ей, что доказывать — пока может только человек.
Все ключевые результаты опубликованы в рецензируемых источниках (Nature, arXiv с верификацией через Lean), однако воспроизводимость зависит от доступа к проприетарным вычислительным ресурсам DeepMind, OpenAI и NVIDIA.
Есть и социальный аспект. Математические олимпиады — не математические исследования. Задача IMO формулируется так, что решение гарантированно существует. В реальном исследовании половина времени уходит на то, чтобы понять, правильно ли поставлен вопрос. Переход от олимпиад к открытым проблемам — качественный скачок, который ещё не совершён.
Новая арифметика доказательств
Пари Литта — маленькая история о большом сдвиге. Два года назад математик мог уверенно сказать: «Мой предмет в безопасности». Сегодня это звучит как «мой предмет трансформируется».
Речь не о замене. Речь о появлении нового инструмента, сопоставимого по значимости с компьютерной алгеброй в 1960-х или численными методами в 1940-х. Каждый раз, когда математика получала новый инструмент, она не сужалась. Она расширялась. Появлялись задачи, которые раньше невозможно было даже сформулировать.
Литт ожидает проиграть пари. Но, возможно, проигрыш окажется выигрышем — для всей математики.
FAQ
Может ли ИИ полностью заменить математиков?
Нет. Текущие системы превосходно доказывают сформулированные утверждения, но не умеют ставить задачи, выбирать направления исследований и оценивать «красоту» теории. ИИ — мощный инструмент, а не автономный исследователь. Ближайшая аналогия — калькулятор: он не заменил математиков, но изменил то, чем они занимаются.
Что такое AlphaProof и чем он отличается от ChatGPT?
AlphaProof — специализированная система Google DeepMind для формальных математических доказательств. В отличие от ChatGPT, который генерирует текст и может ошибаться, AlphaProof работает на языке Lean, где каждый шаг доказательства машинно верифицируем. Если доказательство «компилируется» — оно гарантированно правильно. ChatGPT может написать убедительно выглядящую, но ложную математику; AlphaProof — нет.
Почему математика считалась защищённой от ИИ?
Математическое доказательство требует творческой интуиции: нужно «увидеть» путь к решению, выбрать стратегию, изобрести конструкцию. Это отличается от распознавания паттернов в данных, где ИИ преуспел раньше. Считалось, что без «понимания» смысла формул машина не сможет доказывать теоремы. AlphaProof показал, что обучение с подкреплением в формальной среде может обойти эту проблему.
Какие математические задачи ИИ пока не может решить?
Комбинаторные задачи, требующие изобретения конструкции «с нуля», остаются слабым местом. Также ИИ не умеет формулировать новые гипотезы и определять, какие задачи вообще стоит решать. Открытые проблемы тысячелетия (гипотеза Римана, P vs NP) пока вне досягаемости.
Источники
Связанные
Читайте также
Последний экзамен: тест, который ИИ проваливает
2500 вопросов, которые не гуглятся. GPT-4o набрал 2,7%, человек — 90%. Как устроен самый сложный экзамен для ИИ.
SleepFM: 130 болезней по одной ночи сна
Stanford обучил нейросеть на 585 000 часах сна. Она видит Паркинсон, деменцию и рак за годы до симптомов — по обычной полисомнографии.
GPT-5.2 решил 40-летнюю загадку глюонов
ИИ от OpenAI предложил формулу для глюонных амплитуд, которые с 1986 года считались нулевыми. Физики из Гарварда и Кембриджа подтвердили.