xAI Илона Маска представляет Grok 4: новый лидер в мире искусственного интеллекта?

Обложка

Компания xAI, основанная Илоном Маском, заявила о выпуске Grok 4 – своей новейшей и самой мощной мультимодальной модели искусственного интеллекта. Разработчики уверены, что Grok 4 – это настоящий прорыв, демонстрирующий передовые результаты в академических тестах, математике и логике. А версия Grok 4 Heavy, с расширенными инструментами, показывает еще более впечатляющие результаты в популярных бенчмарках ИИ.

Тесты на логику и общие знания: сможет ли ИИ сдать экзамен за человека?

  • Humanity’s Last Exam (HLE): Grok 4 (без использования внешних инструментов) набрал 25,4%, обойдя Google Gemini 2.5 Pro (21,6%) и OpenAI o3-high (21%). Grok 4 Heavy (с инструментами) достиг 44,4%, в то время как Gemini 2.5 Pro с инструментами показал результат 26,9%.
  • ARC-AGI-2: Здесь Grok 4 показал результат 16,2%, почти в два раза превысив результат ближайшего конкурента – Claude Opus 4.
  • Оценка в стиле MMLU: Grok 4 достиг результата 0,866 (86,6%) с общим индексом интеллекта 73 – лучший показатель в отрасли. (MMLU - Massive Multitask Language Understanding, тест, оценивающий способность модели понимать и отвечать на вопросы по широкому кругу тем).

STEM и программирование: как Grok 4 справляется с точными науками?

  • GPQA: Grok 4 набрал 87,5%, а улучшенная версия Grok 4 Heavy – 88,9%. (GPQA - это сложный набор вопросов, требующих глубокого понимания естественных наук).
  • AIME: Grok 4 Heavy показал идеальный результат – 100%, в то время как обычный Grok 4 достиг 98,8%. (AIME - American Invitational Mathematics Examination, математический экзамен).
  • SWE-Bench: Специализированная версия Grok 4 Code, которая выйдет в августе 2025 года, демонстрирует результат 72-75% на SWE-bench. (SWE-bench - набор тестов для оценки способностей модели к разработке программного обеспечения).

Как утверждает Artificial Analysis, Grok 4 достиг Индекса Интеллекта Artificial Analysis в 73 балла, опередив OpenAI o3 (70) и Google Gemini 2.5 Pro (70).

Grok 4 достиг такого уровня, что практически не ошибается в вопросах по математике и физике, если только они не являются намеренно "подводящими".

Он может выявлять ошибки или двусмысленности в вопросах, исправлять их или отвечать на каждый вариант интерпретации.

— Elon Musk (@elonmusk) July 10, 2025

Сколько это стоит?

Ценовая политика API Grok 4 аналогична Grok 3: 3 доллара (примерно 270 рублей) за 1 миллион входных токенов и 15 долларов (примерно 1350 рублей) за 1 миллион выходных токенов (0,75 доллара (примерно 68 рублей) за 1 миллион кэшированных входных токенов).

Для обычных пользователей xAI предлагает несколько уровней подписки:

  • Базовый (бесплатный): Ограниченный доступ к Grok 3.
  • SuperGrok (30 долларов в месяц, примерно 2700 рублей): Расширенный доступ к моделям Grok 4 и Grok 3.
  • SuperGrok Heavy (300 долларов в месяц, примерно 27000 рублей): Доступ к Grok 4 Heavy, Grok 4 и Grok 3.

Мнение редакции MSReview:

Выпуск Grok 4 компанией xAI – важный шаг вперед в развитии искусственного интеллекта. Высокие результаты в различных тестах демонстрируют передовые возможности модели и её потенциальное влияние на различные отрасли. Ценовая политика, хотя и может показаться высокой для некоторых пользователей, отражает премиальную производительность и эксклюзивный доступ к продвинутым инструментам ИИ. Посмотрим, как Grok 4 проявит себя на рынке и оправдает ли ожидания, возложенные на неё компанией xAI.

MSReview Источник:
www.neowin.net
  • 0




  • Комментарии
Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.