Azure AI ускоряет и персонализирует тонкую настройку GPT-4.1
- Категория: AI Технологии
- Дата: 8 июля 2025 г. в 09:40
- Просмотров: 19
Azure AI делает дообучение GPT-4.1 быстрее и персонализированнее
Когда вы совершаете покупку по ссылкам на нашем сайте, мы можем получить партнерскую комиссию. Вот как это работает.
Microsoft обновила свой портал Azure AI Foundry, а также API и SDK Azure OpenAI Service, чтобы поддержать Direct Preference Optimization (DPO) для GPT-4.1 и GPT-4.1-mini. Direct Preference Optimization (DPO) — это метод тонкой настройки, который можно использовать для корректировки весов модели на основе предпочтений человека, используя пару предпочтительных и непредпочтительных ответов.
Одним из основных преимуществ использования DPO перед Reinforcement Learning from Human Feedback (RLHF) является то, что он вычислительно легче и быстрее, оставаясь при этом столь же эффективным для выравнивания модели. Организации могут использовать этот метод для обучения моделей, чтобы они соответствовали голосу их конкретного бренда, требованиям безопасности или стилям разговора.
Расширение глобального обучения Azure AI
В дополнение к использованию DPO для тонкой настройки модели, Microsoft расширила Глобальное обучение Azure AI до 12 новых регионов, включая Восточную часть США, Западную Европу, Южную часть Великобритании, Северную Швейцарию и другие. Несмотря на расширение, оно все еще считается общедоступной предварительной версией.
Microsoft заявила, что пользователям следует ожидать и следить за новыми функциями, которые появятся в ближайшее время, включая функции приостановки/возобновления и непрерывной тонкой настройки. Она также собирается перенести GPT-4.1-nano в эти новые регионы.
Расширение Глобального обучения важно для суверенитета данных, который становится все более важным вопросом, поскольку Европейский Союз настаивает на том, чтобы данные европейцев обрабатывались в Европе для обеспечения большей конфиденциальности.
Новый API Responses
Наконец, Microsoft выпустила новый API Responses, который поддерживает ваши точно настроенные модели, что упрощает разработчикам их использование в других приложениях. Microsoft заявила, что этот API идеально подходит для агентских рабочих процессов, поскольку "он поддерживает многооборотные разговоры с отслеживанием состояния и позволяет беспрепятственно вызывать инструменты, автоматически соединяя все в фоновом режиме".
API Responses также может отслеживать разговоры, чтобы модель могла запоминать контекст, вы можете видеть, как модели обосновывают ответы, он может позволить пользователям проверять ход выполнения во время создания ответа, и он поддерживает фоновую обработку и работает с такими инструментами, как веб-поиск и поиск файлов.
Изображение через Depositphotos.com
Мнение редакции MSReview: Microsoft продолжает активно развивать свои AI-сервисы в Azure, предлагая инструменты для более быстрой и персонализированной настройки моделей. DPO выглядит многообещающим методом, а расширение географии Global Training подчеркивает важность соответствия требованиям по локализации данных. Новый API Responses также может значительно упростить интеграцию AI-моделей в различные приложения.
- Комментарии