Microsoft выкатила свои AI-чипы: Maia 200 — зверь для инференса
- Категория: Artificial_intelligence
- Дата: 27 января 2026 г. в 00:00
- Просмотров: 13

Microsoft наконец-то представила свои собственные AI-чипы — Maia 200! 🤯 Это просто зверь, заточенный под самые тяжелые AI-задачи, и, кажется, он готов потягаться с лучшими от Amazon и Google.

Сделан этот монстр на 3-нанометровом техпроцессе от TSMC. Microsoft хвастается, что это "самый производительный собственный кремний от любого гиперскейлера". И это не пустые слова: Maia 200 выдаёт в три раза больше FP4-производительности, чем Trainium третьего поколения от Amazon, и уделывает Google TPU седьмого поколения по FP8. 🚀
Что такое FP4 и FP8? Это форматы чисел с плавающей запятой, которые используются для ускорения вычислений в AI. FP8, например, отлично балансирует между точностью и скоростью, что идеально для многих AI-задач.
Но это не всё! Maia 200 не только быстрее, но и эффективнее. Microsoft утверждает, что он дает на 30% больше производительности на доллар по сравнению с предыдущим поколением их же железа. Экономия — наше всё! 💰
Уже сейчас Maia 200 трудится в дата-центре Microsoft в Айове, а скоро доберется и до солнечной Аризоны.

Один из вице-президентов Microsoft, Скотт Гатри, упомянул, что чип разработан для жидкостного охлаждения. Это куда эффективнее воздушного, и, что важно, "без потерь воды". 💪 Так что, забота об экологии и сообществах — это тоже в приоритете, особенно учитывая, что дата-центры часто критикуют за потребление ресурсов.
Вся эта история с AI-чипами раскручивается на фоне новостей о том, что OpenAI, ребята из ChatGPT, могут потерять до 14 миллиардов долларов в 2026 году. 😮 Тренировка AI-моделей — это космос по затратам, но даже после обучения "кормить" их (то есть, получать ответы) — тоже стоит денег.
Microsoft заявляет, что Maia 200 — это самая эффективная система для "инференса" (то есть, когда AI реально отвечает на ваши вопросы), которую они когда-либо выпускали. А ещё эти 30% производительности на доллар — это прямо бальзам на душу для OpenAI и других, кто будет использовать Maia 200.
Microsoft уже подтвердила: Maia 200 будет использоваться для обслуживания таких моделей, как GPT-5.2 от OpenAI, помогая снизить затраты на Microsoft Foundry и Microsoft 365 Copilot. 🤖
Maia 200 — это такой "ускоритель инференса". Его главная задача — сделать генерацию "токенов" (именно так AI обрабатывает информацию и отвечает) более доступной. Тренировка модели — это разовые, огромные траты. А вот инференс — это постоянные, ежедневные расходы. Microsoft заточила этот чип именно под эту задачу, чтобы снизить стоимость каждого ответа AI.
Если Maia 200 оправдает ожидания, он реально может помочь OpenAI и другим компаниям сделать большие языковые модели более экономически выгодными. 📈
Microsoft с Maia 200 пытается решить главную боль AI — его дороговизну. Если их чип действительно сократит расходы на инференс, это может стать переломным моментом для прибыльности AI-компаний.
- Евгений (MSReview)
- Комментарии

