xAI Илона Маска представляет Grok 4: новый лидер в мире искусственного интеллекта?

Категория: AI Технологии
Дата: 10 июля 2025 г. в 18:55
Просмотров: 380

Обложка

Компания xAI, основанная Илоном Маском, заявила о выпуске Grok 4 – своей новейшей и самой мощной мультимодальной модели искусственного интеллекта. Разработчики уверены, что Grok 4 – это настоящий прорыв, демонстрирующий передовые результаты в академических тестах, математике и логике. А версия Grok 4 Heavy, с расширенными инструментами, показывает еще более впечатляющие результаты в популярных бенчмарках ИИ.

Тесты на логику и общие знания: сможет ли ИИ сдать экзамен за человека?

Humanity’s Last Exam (HLE): Grok 4 (без использования внешних инструментов) набрал 25,4%, обойдя Google Gemini 2.5 Pro (21,6%) и OpenAI o3-high (21%). Grok 4 Heavy (с инструментами) достиг 44,4%, в то время как Gemini 2.5 Pro с инструментами показал результат 26,9%.
ARC-AGI-2: Здесь Grok 4 показал результат 16,2%, почти в два раза превысив результат ближайшего конкурента – Claude Opus 4.
Оценка в стиле MMLU: Grok 4 достиг результата 0,866 (86,6%) с общим индексом интеллекта 73 – лучший показатель в отрасли. (MMLU - Massive Multitask Language Understanding, тест, оценивающий способность модели понимать и отвечать на вопросы по широкому кругу тем).

STEM и программирование: как Grok 4 справляется с точными науками?

GPQA: Grok 4 набрал 87,5%, а улучшенная версия Grok 4 Heavy – 88,9%. (GPQA - это сложный набор вопросов, требующих глубокого понимания естественных наук).
AIME: Grok 4 Heavy показал идеальный результат – 100%, в то время как обычный Grok 4 достиг 98,8%. (AIME - American Invitational Mathematics Examination, математический экзамен).
SWE-Bench: Специализированная версия Grok 4 Code, которая выйдет в августе 2025 года, демонстрирует результат 72-75% на SWE-bench. (SWE-bench - набор тестов для оценки способностей модели к разработке программного обеспечения).

Как утверждает Artificial Analysis, Grok 4 достиг Индекса Интеллекта Artificial Analysis в 73 балла, опередив OpenAI o3 (70) и Google Gemini 2.5 Pro (70).

Grok 4 достиг такого уровня, что практически не ошибается в вопросах по математике и физике, если только они не являются намеренно "подводящими".

Он может выявлять ошибки или двусмысленности в вопросах, исправлять их или отвечать на каждый вариант интерпретации.

— Elon Musk (@elonmusk) July 10, 2025

Сколько это стоит?

Ценовая политика API Grok 4 аналогична Grok 3: 3 доллара (примерно 270 рублей) за 1 миллион входных токенов и 15 долларов (примерно 1350 рублей) за 1 миллион выходных токенов (0,75 доллара (примерно 68 рублей) за 1 миллион кэшированных входных токенов).

Для обычных пользователей xAI предлагает несколько уровней подписки:

Базовый (бесплатный): Ограниченный доступ к Grok 3.
SuperGrok (30 долларов в месяц, примерно 2700 рублей): Расширенный доступ к моделям Grok 4 и Grok 3.
SuperGrok Heavy (300 долларов в месяц, примерно 27000 рублей): Доступ к Grok 4 Heavy, Grok 4 и Grok 3.

Мнение редакции MSReview:

Выпуск Grok 4 компанией xAI – важный шаг вперед в развитии искусственного интеллекта. Высокие результаты в различных тестах демонстрируют передовые возможности модели и её потенциальное влияние на различные отрасли. Ценовая политика, хотя и может показаться высокой для некоторых пользователей, отражает премиальную производительность и эксклюзивный доступ к продвинутым инструментам ИИ. Посмотрим, как Grok 4 проявит себя на рынке и оправдает ли ожидания, возложенные на неё компанией xAI.

Следите за обновлениями Microsoft

Свежие новости, разборы и инструкции в удобном формате.

Telegram RSS AI Технологии

Редакция MSReview Источник:
www.neowin.net

Похожие новости

Google Search с ИИ теперь строит графики и диаграммы: что это значит для вас?

Неожиданный поворот: OpenAI столкнулась с иском и удалила все упоминания о проекте "io" с Джони Айвом

Meta бросает вызов лидерам ИИ: Цукерберг создает лабораторию суперинтеллекта и переманивает звезд из OpenAI и Google

Искусственный интеллект наступает: грядут ли новые сокращения в Amazon?

Наши спонсоры

Фриланс-биржа с характером

TipTop.org — это удобный сервис для заработка, где заказчики размещают оплачиваемые проекты и задания. Система позволяет начать работу с выполнения простых заказов как новичкам, так и продвинутые возможности по публикации услуги для профессиональных фрилансеров

МоиПесни.РФ — Поздравьте близких персональной песней

МоиПесни.рф — онлайн-сервис, который с помощью нейросети за пару минут создает уникальные песни по вашему сценарию: поздравления, любовные треки, шутливые куплеты и многое другое. Просто опишите повод и героя, выберите стиль — и получите готовую песню с текстом и вокалом.

Комментарии

Информация

Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.