Математики не смогли превзойти нейросеть в решении сложных задач

В Беркли (Калифорния, США) прошло закрытое двухдневное мероприятие с участием 30 ведущих математиков мира, организованное некоммерческой организацией Epoch AI. Целью встречи стало испытание новой ИИ-модели OpenAI — чат-бота GPT-4o mini, обладающего выдающимися способностями к логическим рассуждениям. Математикам предстояло протестировать бота с помощью 300 уникальных задач, ранее не опубликованных в Сети.
Ученым запрещалось общаться между собой вне эксперимента, чтобы сохранить чистоту тестирования. Уже на предварительном этапе GPT-4o mini решил около 20% задач, а в ходе самой встречи бот впечатлил участников способностью находить нестандартные и точные решения на уровне исследовательской математики. Например, он справился с задачей из теории чисел, достойной докторской диссертации, поразив судью и руководителя встречи Кена Оно.
Кульминацией эксперимента стали десять задач высочайшего уровня сложности, за нерешённую из которых автор получал $7500. Несмотря на то, что бот не справился с некоторыми из них, математики были потрясены уровнем развития модели — скорость её рассуждений и глубина анализа уже превосходят возможности многих аспирантов.
Ранее Google DeepMind представила AlphaGeometry 2 и AlphaProof, которые успешно решили ряд задач Международной математической олимпиады. Однако, по мнению вице-президента DeepMind, ИИ пока не способен заменить людей-математиков: он остаётся мощным инструментом, но лишён интуиции и творческого мышления, необходимого для создания новых теорий.
Зарегистрируйтесь, чтобы оставлять комментарии
Вход
Заходите через социальные сети
FacebookTwitter