Microsoft выкатила свои AI-чипы: Maia 200 — зверь для инференса

Обложка

Microsoft наконец-то представила свои собственные AI-чипы — Maia 200! 🤯 Это просто зверь, заточенный под самые тяжелые AI-задачи, и, кажется, он готов потягаться с лучшими от Amazon и Google.

Maia 200

Сделан этот монстр на 3-нанометровом техпроцессе от TSMC. Microsoft хвастается, что это "самый производительный собственный кремний от любого гиперскейлера". И это не пустые слова: Maia 200 выдаёт в три раза больше FP4-производительности, чем Trainium третьего поколения от Amazon, и уделывает Google TPU седьмого поколения по FP8. 🚀

Что такое FP4 и FP8? Это форматы чисел с плавающей запятой, которые используются для ускорения вычислений в AI. FP8, например, отлично балансирует между точностью и скоростью, что идеально для многих AI-задач.

Но это не всё! Maia 200 не только быстрее, но и эффективнее. Microsoft утверждает, что он дает на 30% больше производительности на доллар по сравнению с предыдущим поколением их же железа. Экономия — наше всё! 💰

Уже сейчас Maia 200 трудится в дата-центре Microsoft в Айове, а скоро доберется и до солнечной Аризоны.

Maia 200

Один из вице-президентов Microsoft, Скотт Гатри, упомянул, что чип разработан для жидкостного охлаждения. Это куда эффективнее воздушного, и, что важно, "без потерь воды". 💪 Так что, забота об экологии и сообществах — это тоже в приоритете, особенно учитывая, что дата-центры часто критикуют за потребление ресурсов.

Вся эта история с AI-чипами раскручивается на фоне новостей о том, что OpenAI, ребята из ChatGPT, могут потерять до 14 миллиардов долларов в 2026 году. 😮 Тренировка AI-моделей — это космос по затратам, но даже после обучения "кормить" их (то есть, получать ответы) — тоже стоит денег.

Microsoft заявляет, что Maia 200 — это самая эффективная система для "инференса" (то есть, когда AI реально отвечает на ваши вопросы), которую они когда-либо выпускали. А ещё эти 30% производительности на доллар — это прямо бальзам на душу для OpenAI и других, кто будет использовать Maia 200.

Microsoft уже подтвердила: Maia 200 будет использоваться для обслуживания таких моделей, как GPT-5.2 от OpenAI, помогая снизить затраты на Microsoft Foundry и Microsoft 365 Copilot. 🤖

Maia 200 — это такой "ускоритель инференса". Его главная задача — сделать генерацию "токенов" (именно так AI обрабатывает информацию и отвечает) более доступной. Тренировка модели — это разовые, огромные траты. А вот инференс — это постоянные, ежедневные расходы. Microsoft заточила этот чип именно под эту задачу, чтобы снизить стоимость каждого ответа AI.

Если Maia 200 оправдает ожидания, он реально может помочь OpenAI и другим компаниям сделать большие языковые модели более экономически выгодными. 📈

Microsoft с Maia 200 пытается решить главную боль AI — его дороговизну. Если их чип действительно сократит расходы на инференс, это может стать переломным моментом для прибыльности AI-компаний.

- Евгений (MSReview)

MSReview Источник:
www.windowscentral.com
  • 0

Наши спонсоры
Фриланс-биржа с характером

TipTop.org — это удобный сервис для заработка, где заказчики размещают оплачиваемые проекты и задания. Система позволяет начать работу с выполнения простых заказов как новичкам, так и продвинутые возможности по публикации услуги для профессиональных фрилансеров




  • Комментарии
Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.