xAI Илона Маска представляет Grok 4: новый лидер в мире искусственного интеллекта?
- Категория: AI Технологии
- Дата: 10 июля 2025 г. в 18:55
- Просмотров: 61
Компания xAI, основанная Илоном Маском, заявила о выпуске Grok 4 – своей новейшей и самой мощной мультимодальной модели искусственного интеллекта. Разработчики уверены, что Grok 4 – это настоящий прорыв, демонстрирующий передовые результаты в академических тестах, математике и логике. А версия Grok 4 Heavy, с расширенными инструментами, показывает еще более впечатляющие результаты в популярных бенчмарках ИИ.
Тесты на логику и общие знания: сможет ли ИИ сдать экзамен за человека?
- Humanity’s Last Exam (HLE): Grok 4 (без использования внешних инструментов) набрал 25,4%, обойдя Google Gemini 2.5 Pro (21,6%) и OpenAI o3-high (21%). Grok 4 Heavy (с инструментами) достиг 44,4%, в то время как Gemini 2.5 Pro с инструментами показал результат 26,9%.
- ARC-AGI-2: Здесь Grok 4 показал результат 16,2%, почти в два раза превысив результат ближайшего конкурента – Claude Opus 4.
- Оценка в стиле MMLU: Grok 4 достиг результата 0,866 (86,6%) с общим индексом интеллекта 73 – лучший показатель в отрасли. (MMLU - Massive Multitask Language Understanding, тест, оценивающий способность модели понимать и отвечать на вопросы по широкому кругу тем).
STEM и программирование: как Grok 4 справляется с точными науками?
- GPQA: Grok 4 набрал 87,5%, а улучшенная версия Grok 4 Heavy – 88,9%. (GPQA - это сложный набор вопросов, требующих глубокого понимания естественных наук).
- AIME: Grok 4 Heavy показал идеальный результат – 100%, в то время как обычный Grok 4 достиг 98,8%. (AIME - American Invitational Mathematics Examination, математический экзамен).
- SWE-Bench: Специализированная версия Grok 4 Code, которая выйдет в августе 2025 года, демонстрирует результат 72-75% на SWE-bench. (SWE-bench - набор тестов для оценки способностей модели к разработке программного обеспечения).
Как утверждает Artificial Analysis, Grok 4 достиг Индекса Интеллекта Artificial Analysis в 73 балла, опередив OpenAI o3 (70) и Google Gemini 2.5 Pro (70).
Grok 4 достиг такого уровня, что практически не ошибается в вопросах по математике и физике, если только они не являются намеренно "подводящими".
Он может выявлять ошибки или двусмысленности в вопросах, исправлять их или отвечать на каждый вариант интерпретации.
— Elon Musk (@elonmusk) July 10, 2025
Сколько это стоит?
Ценовая политика API Grok 4 аналогична Grok 3: 3 доллара (примерно 270 рублей) за 1 миллион входных токенов и 15 долларов (примерно 1350 рублей) за 1 миллион выходных токенов (0,75 доллара (примерно 68 рублей) за 1 миллион кэшированных входных токенов).
Для обычных пользователей xAI предлагает несколько уровней подписки:
- Базовый (бесплатный): Ограниченный доступ к Grok 3.
- SuperGrok (30 долларов в месяц, примерно 2700 рублей): Расширенный доступ к моделям Grok 4 и Grok 3.
- SuperGrok Heavy (300 долларов в месяц, примерно 27000 рублей): Доступ к Grok 4 Heavy, Grok 4 и Grok 3.
Мнение редакции MSReview:
Выпуск Grok 4 компанией xAI – важный шаг вперед в развитии искусственного интеллекта. Высокие результаты в различных тестах демонстрируют передовые возможности модели и её потенциальное влияние на различные отрасли. Ценовая политика, хотя и может показаться высокой для некоторых пользователей, отражает премиальную производительность и эксклюзивный доступ к продвинутым инструментам ИИ. Посмотрим, как Grok 4 проявит себя на рынке и оправдает ли ожидания, возложенные на неё компанией xAI.
- Комментарии