Нейросеть Copilot заговорила: новый AI-голос звучит живее, чем ChatGPT
- Категория: AI Технологии
- Дата: 29 августа 2025 г. в 17:30
- Просмотров: 65
Microsoft не перестает удивлять! Вслед за Copilot Vision, инструментом анализа экрана на базе искусственного интеллекта, компания тестирует новую разработку — Copilot Audio Expressions. Эта нейросеть умеет генерировать реалистичные аудиофайлы из текста, причем звучание получается очень человечным. Более того, Copilot Audio может даже проявить креативность и добавить что-то от себя!
Команда Windows Latest уже успела протестировать новинку на сайте Copilot Labs. Инструмент предлагает два режима: Emotive (Эмоциональный) и Story (История). В каждом режиме доступно множество голосов и стилей. Наши коллеги подробно изучили функцию, попробовали разные варианты и остались впечатлены качеством работы. Единственный минус — пока поддерживается только английский язык.
Первые шаги с Copilot Audio Expressions
Для начала мы взяли вымышленный сценарий, описывающий оживленную железнодорожную станцию. Этот текст мы вставили в поле запроса, добавив строку, указывающую желаемый стиль голоса.
!Выбор режима Copilot Audio
Мы выбрали режим Emote с голосом Oak и стилем narration (повествование). Copilot Audio довольно быстро сгенерировал аудио, которое можно было прослушать во встроенном веб-плеере.
!Выбор стиля Copilot
В режиме Emote максимальная длина аудиоклипа составляет 59 секунд. Мы ожидали, что нейросеть просто зачитает текст. Но Copilot Audio превзошел все ожидания! Он не просто озвучил сценарий, а добавил детали, перефразировал предложения, чтобы они звучали живее и интереснее. Получилось очень здорово!
https://www.windowslatest.com/wp-content/uploads/2025/08/Copilot_Audio_20250829_180938.mp3
Еще один приятный момент — аудиофайл можно скачать в формате MP3 без регистрации. Это значит, что его можно будет воспроизвести на любом устройстве. Режим Emote впечатлил нас своей детализированностью, но мы решили изучить и режим Story.
Создание захватывающих историй с режимом Story
В режиме Story нейросеть автоматически выбирает голос и стиль, без возможности ручной настройки. Мы решили дать простой запрос: «расскажи историю о кошке, крадущейся в тени в поисках добычи».
На этот раз Copilot Audio сочинил 90-секундную историю о человеке, рассказывающем о кошке. В истории есть голос рассказчика (с американским акцентом) и голос кошки (да, кошка говорит и выражает свой голод) с британским акцентом. Оба голоса отлично сочетаются друг с другом и создают впечатление настоящей коллаборации.
!Выбор режима истории Copilot AI
Вы можете послушать оба аудиофрагмента и оценить качество:
https://www.windowslatest.com/wp-content/uploads/2025/08/Copilot_Audio_20250829_181143.mp3
Copilot Audio Expressions — это многообещающий инструмент для генерации аудио на базе ИИ. Если вам нужно создать аудиоклип, обязательно попробуйте его на сайте Copilot Labs.
Мнение редакции MSReview: Copilot Audio Expressions — это большой шаг вперед в области создания аудио с помощью искусственного интеллекта. Возможность генерировать реалистичные аудиоклипы с разными стилями и акцентами открывает новые возможности для создателей контента и всех, кто ищет новые способы взаимодействия с аудиторией. Особенно впечатляет режим Story, который показывает, как ИИ может создавать увлекательные истории.
- Комментарии