OpenAI объявляет о значительных обновлениях Codex и инструментов для голосовых агентов
- Категория: Софт
- Дата: 4 июня 2025 г. в 09:00
- Просмотров: 64
OpenAI, помимо предоставления опыта ChatGPT для сотен миллионов пользователей ежедневно, также активно работает над созданием платформы для разработчиков, создающих приложения на основе ИИ. OpenAI популярна среди разработчиков не только благодаря своим передовым моделям, но и из-за мощных инструментов и поддержки.
Сегодня OpenAI анонсировала два значительных обновления для разработчиков. Первое касается Codex, агента по разработке программного обеспечения от OpenAI. Теперь Codex доступен пользователям ChatGPT Plus. На ограниченное время пользователи ChatGPT Plus смогут пользоваться щедрыми лимитами использования, однако в периоды высокого спроса будут применяться ограничения скорости.
Codex теперь может подключаться к интернету для установки зависимостей, обновления пакетов, запуска тестов, требующих внешних ресурсов, и многого другого. OpenAI уточнила, что доступ в интернет по умолчанию отключен, но пользователи могут включить его для определенных сред. Также можно контролировать конкретные домены, к которым Codex имеет доступ, и другие параметры. Эта возможность доступа в интернет через Codex доступна для пользователей ChatGPT Plus, Pro и Teams, а скоро станет доступной и для пользователей Enterprise.
С сегодняшним обновлением пользователи Codex могут обновлять существующие запросы на включение изменений при выполнении задач. Кроме того, теперь пользователи могут диктовать задачи Codex.
Помимо вышеперечисленного и исправлений ошибок, OpenAI внесла следующие улучшения в Codex:
- Добавлена поддержка бинарных файлов: при применении патчей поддерживаются все операции с файлами. При использовании PR пока поддерживается только удаление или переименование бинарных файлов.
- Улучшены сообщения об ошибках для скриптов настройки.
- Увеличен лимит на различия задач с 1 МБ до 5 МБ.
- Увеличен лимит продолжительности скрипта настройки с 5 до 10 минут.
- Улучшен процесс подключения к GitHub.
- Возобновлены живые активности на iOS после устранения проблемы с пропущенными уведомлениями.
- Удалено обязательное требование двухфакторной аутентификации для пользователей, использующих SSO или социальные логины.
Второе крупное обновление от OpenAI сегодня касается голосовых агентов. SDK для агентов OpenAI теперь доступен на TypeScript и включает поддержку передачи задач, защитных механизмов, трассировки, MCP и других основных примитивов агентов. Этот SDK также предоставляет новую возможность для утверждений с участием человека, позволяя разработчикам приостанавливать выполнение инструментов, сериализовать и сохранять состояние агента, одобрять или отклонять определенные вызовы и возобновлять работу агента.
OpenAI также выпустила обновленную модель преобразования речи в речь с улучшениями в надежности следования инструкциям, последовательности вызовов инструментов и поведения при прерываниях. Кроме того, разработчики теперь могут настраивать скорость речи голосового агента на каждой сессии. Обновленная модель доступна через gpt-4o-realtime-preview-2025-06-03 в Realtime API и gpt-4o-audio-preview-2025-06-03 в Chat Completions API.
Наконец, панель Traces теперь поддерживает сессии Realtime API, позволяя разработчикам легко визуализировать выполнение голосовых агентов, включая ввод/вывод аудио, вызовы инструментов и прерывания.
Комментарий эксперта MSReview: Эти обновления от OpenAI демонстрируют их стремление к улучшению инструментов для разработчиков, делая платформу еще более гибкой и мощной. Доступ Codex к интернету и новые возможности голосовых агентов открывают широкие перспективы для создания сложных и функциональных приложений на базе ИИ. Особенно примечательно расширение поддержки для ChatGPT Plus пользователей, что может привлечь больше разработчиков к экосистеме OpenAI.
- Комментарии