Нейросеть Copilot заговорила: новый AI-голос звучит живее, чем ChatGPT

  • Категория: AI Технологии
  • Дата: 29 августа 2025 г. в 17:30
  • Просмотров: 65

Обложка

Microsoft не перестает удивлять! Вслед за Copilot Vision, инструментом анализа экрана на базе искусственного интеллекта, компания тестирует новую разработку — Copilot Audio Expressions. Эта нейросеть умеет генерировать реалистичные аудиофайлы из текста, причем звучание получается очень человечным. Более того, Copilot Audio может даже проявить креативность и добавить что-то от себя!

Команда Windows Latest уже успела протестировать новинку на сайте Copilot Labs. Инструмент предлагает два режима: Emotive (Эмоциональный) и Story (История). В каждом режиме доступно множество голосов и стилей. Наши коллеги подробно изучили функцию, попробовали разные варианты и остались впечатлены качеством работы. Единственный минус — пока поддерживается только английский язык.

Первые шаги с Copilot Audio Expressions

Для начала мы взяли вымышленный сценарий, описывающий оживленную железнодорожную станцию. Этот текст мы вставили в поле запроса, добавив строку, указывающую желаемый стиль голоса.

!Выбор режима Copilot Audio

Мы выбрали режим Emote с голосом Oak и стилем narration (повествование). Copilot Audio довольно быстро сгенерировал аудио, которое можно было прослушать во встроенном веб-плеере.

!Выбор стиля Copilot

В режиме Emote максимальная длина аудиоклипа составляет 59 секунд. Мы ожидали, что нейросеть просто зачитает текст. Но Copilot Audio превзошел все ожидания! Он не просто озвучил сценарий, а добавил детали, перефразировал предложения, чтобы они звучали живее и интереснее. Получилось очень здорово!

https://www.windowslatest.com/wp-content/uploads/2025/08/Copilot_Audio_20250829_180938.mp3

Еще один приятный момент — аудиофайл можно скачать в формате MP3 без регистрации. Это значит, что его можно будет воспроизвести на любом устройстве. Режим Emote впечатлил нас своей детализированностью, но мы решили изучить и режим Story.

Создание захватывающих историй с режимом Story

В режиме Story нейросеть автоматически выбирает голос и стиль, без возможности ручной настройки. Мы решили дать простой запрос: «расскажи историю о кошке, крадущейся в тени в поисках добычи».

На этот раз Copilot Audio сочинил 90-секундную историю о человеке, рассказывающем о кошке. В истории есть голос рассказчика (с американским акцентом) и голос кошки (да, кошка говорит и выражает свой голод) с британским акцентом. Оба голоса отлично сочетаются друг с другом и создают впечатление настоящей коллаборации.

!Выбор режима истории Copilot AI

Вы можете послушать оба аудиофрагмента и оценить качество:

https://www.windowslatest.com/wp-content/uploads/2025/08/Copilot_Audio_20250829_181143.mp3

Copilot Audio Expressions — это многообещающий инструмент для генерации аудио на базе ИИ. Если вам нужно создать аудиоклип, обязательно попробуйте его на сайте Copilot Labs.

Мнение редакции MSReview: Copilot Audio Expressions — это большой шаг вперед в области создания аудио с помощью искусственного интеллекта. Возможность генерировать реалистичные аудиоклипы с разными стилями и акцентами открывает новые возможности для создателей контента и всех, кто ищет новые способы взаимодействия с аудиторией. Особенно впечатляет режим Story, который показывает, как ИИ может создавать увлекательные истории.

MSReview Источник:
www.windowslatest.com
  • 0




  • Комментарии
Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.