Искусственный интеллект покоряет математические вершины: Gemini от Google на уровне лучших участников олимпиады

Обложка

Представьте себе соревнование, где самые талантливые математики мира решают сложнейшие задачи. Это Международная математическая олимпиада (IMO), и победа в ней – престижное достижение. Каждый год лишь около 8% участников удостаиваются золотой медали.

В этом году в олимпиаде "приняли участие" не только люди, но и новейшие разработки в области искусственного интеллекта (ИИ) от OpenAI и Google. И результаты впечатляют!

Недавно OpenAI заявила, что их экспериментальная LLM (большая языковая модель) для логических рассуждений достигла уровня золотой медали. Модель решала задачи IMO 2025 года по тем же правилам, что и студенты: две сессии по 4,5 часа без доступа к интернету или каким-либо инструментам, представляя решения в виде доказательств на естественном языке.

Мы достигли уровня золотой медали 🥇на Международной математической олимпиаде 2025 года с помощью LLM общего назначения для логических рассуждений!

Наша модель решила математические задачи мирового класса — на уровне лучших участников-людей. Важная веха для ИИ и математики.

Вслед за этим Google объявила, что продвинутая версия их модели Gemini Deep Think успешно решила пять из шести задач IMO, также достигнув уровня золотой медали. Эта версия основана на улучшенном режиме логических рассуждений и использует новейшие разработки Google DeepMind, включая параллельное мышление. Это позволяет Gemini одновременно рассматривать несколько вариантов решения, а не перебирать их последовательно.

Команда Google DeepMind поделилась подробностями об этой продвинутой версии Gemini Deep Think:

"Чтобы максимально использовать возможности логических рассуждений Deep Think, мы дополнительно обучили эту версию Gemini с использованием новых методов обучения с подкреплением, которые могут использовать больше данных о многоэтапных рассуждениях, решении задач и доказательстве теорем. Мы также предоставили Gemini доступ к курируемому корпусу высококачественных решений математических задач и добавили в ее инструкции несколько общих советов и рекомендаций о том, как подходить к задачам IMO".

В ближайшем будущем Google планирует предоставить эту новую версию модели Deep Think группе доверенных тестировщиков. В дальнейшем она станет доступна и для подписчиков Google AI Ultra.

Мнение редакции MSReview: Достижения Google и OpenAI в области решения математических задач с использованием LLM демонстрируют огромный потенциал искусственного интеллекта. Эти модели не просто "вычисляют", а логически рассуждают и находят решения, что открывает новые перспективы для применения ИИ в науке, образовании и других сферах.

MSReview Источник:
www.neowin.net
  • 0




  • Комментарии
Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.