Искусственный интеллект подстраивается под вас: как Azure AI ускоряет настройку GPT-4.1
- Категория: AI Технологии
- Дата: 8 июля 2025 г. в 10:00
- Просмотров: 22
Microsoft выпустила обновление для Azure AI Foundry, а также для API и SDK Azure OpenAI Service, чтобы внедрить Direct Preference Optimization (DPO) для GPT-4.1 и GPT-4.1-mini. Что же такое DPO? Представьте себе, что вы учите нейросеть отвечать так, как вам нужно, показывая ей примеры хороших и плохих ответов. DPO – это как раз такой метод "тонкой настройки", который позволяет корректировать работу модели на основе ваших предпочтений, используя пары "предпочтительный ответ" и "нежелательный ответ".
В чем "соль"?
Главное преимущество DPO перед Reinforcement Learning from Human Feedback (RLHF) в том, что он требует меньше вычислительных ресурсов и времени. При этом он так же эффективен для "выравнивания" модели, то есть приведения её работы в соответствие с вашими ожиданиями. Теперь компании смогут обучать модели, чтобы они говорили голосом их бренда, соответствовали требованиям безопасности или использовали определенный стиль общения.
Мир становится ближе: Azure AI расширяет горизонты
Microsoft не только добавила DPO, но и расширила возможности глобального обучения Azure AI до 12 новых регионов, включая Восточную часть США, Западную Европу, Южную часть Великобритании, Северную Швейцарию и другие. Это означает, что больше компаний смогут воспользоваться преимуществами Azure AI, где бы они ни находились. Пока что это общедоступная предварительная версия, но Microsoft обещает, что в ближайшее время появятся новые функции, включая возможность приостановки/возобновления и непрерывную тонкую настройку. В планах также перенос GPT-4.1-nano в эти регионы.
Зачем это нужно?
Расширение глобального обучения важно для обеспечения суверенитета данных. В условиях, когда Европейский союз настаивает на обработке данных европейцев в Европе для обеспечения большей конфиденциальности, это становится критически важным.
Новый API Responses: ключ к удобству
И последнее, но не менее важное: Microsoft выпустила новый API Responses, который упрощает использование точно настроенных моделей в других приложениях. По словам Microsoft, этот API идеально подходит для рабочих процессов, поскольку "он поддерживает многооборотные разговоры с сохранением состояния и обеспечивает бесшовный вызов инструментов, автоматически соединяя все вместе в фоновом режиме".
Что умеет API Responses?
- Отслеживает разговоры, чтобы модель запоминала контекст.
- Позволяет видеть, как модель рассуждает, давая ответы.
- Дает возможность пользователям проверять прогресс во время создания ответа.
- Поддерживает фоновую обработку и работает с такими инструментами, как веб-поиск и поиск файлов.
Изображение через Depositphotos.com
Мнение MSReview: Новые возможности Azure AI, такие как Direct Preference Optimization (DPO) и API Responses, открывают большие возможности для бизнеса. Более быстрая и персонализированная настройка моделей GPT-4.1 позволит компаниям создавать AI-решения, которые лучше соответствуют их потребностям. Улучшенная поддержка многооборотных разговоров и интеграция с инструментами делают эти решения еще более привлекательными для использования в различных бизнес-процессах.

- Комментарии