AI-модели Google и OpenAI впервые в истории решили задачи Международной математической олимпиады (IMO) на уровне золотых медалистов. Такой результат ранее был доступен лишь лучшим школьникам-математикам.
Обе компании использовали универсальные языковые модели, а не специализированные системы:
- Google задействовала новую версию Gemini DeepMind Deep Think, представленную в мае. Она решила 5 из 6 задач в официальном формате олимпиады, уложившись в лимит 4,5 часа. Ответы прошли верификацию жюри IMO.
- OpenAI использовала экспериментальную версию модели на основе своей линейки reasoning models, ориентированных на «computation at test time» – глубокое параллельное рассуждение с распределением вычислений между цепочками вывода. Проверку проводили трое внешних призеров IMO
Почему это важно?
Универсальные модели начинают справляться с задачами, требующими не просто запоминания или статистики, а глубокого абстрактного мышления, многошагового вывода и гибкости рассуждений. Совсем скоро ученые смогут использовать их в научных открытиях, фундаментальной математике и задачах, где пока нет решений.