Аватар Azure, преобразующий текст в речь, может беспокоить пользователей своими странными характеристиками долины.

Microsoft наверняка усовершенствует эту технологию, пришло время сделать ее более человечной.

Аватар преобразования текста в речь Azure

Microsoft объявила о выпуске аватара Azure для преобразования текста в речь на конференции Microsoft Ignite конференция пройдет в Сиэтле с 14 по 17 ноября 2023 года. Аватар Azure теперь находится в общедоступной предварительной версии, и пользователи Azure во всем мире могут создавать свои аватары только с помощью текстового ввода.

Мы рады объявить о выпуске общедоступной предварительной версии Речь Azure AI преобразование текста в речь аватара — новая функция, которая позволяет пользователям создавать видеоролики с говорящими аватарами с вводом текста, а также создавать интерактивных ботов, работающих в реальном времени, обученных с использованием изображений людей.

Майкрософт

Технический гигант из Редмонда считает, что аватар Azure, преобразующий текст в речь, может стать подходящим решением для борьбы с традиционное создание видеоконтента, и небольшие компании, такие как стартапы, могут получить большую выгоду от такого инструмент.

Традиционное создание видеоконтента требует много времени и бюджета, включая настройку среды видеосъемки, съемку видеороликов, монтаж и т. д. С помощью аватара, преобразующего текст в речь, пользователи могут более эффективно создавать видео. Пользователи могут использовать аватар для создания обучающих видеороликов, презентаций продуктов, отзывов клиентов и т. д., просто вводя текст.

Майкрософт

Аватар преобразования текста в речь можно использовать для различных приложений:

  • Чат-бот для туристического сайта
  • Виртуальные продажи в живой рекламе
  • Учитель искусственного интеллекта, который преподает онлайн и может отвечать на вопросы
  • Виртуальный HR для ответа на вопросы сотрудников

Хотя этот инструмент будет весьма полезен для многих компаний, он также может создавать видеоролики, в которых почему-то отсутствует полный спектр человеческих выражений. Вот почему:

Аватар Azure с функцией преобразования текста в речь может быть полезен, но он не кажется реальным

Важно знать, что Microsoft предлагает 2 способа создания аватара:

  • Готовые аватары для преобразования текста в речь, при этом Microsoft предоставляет список опций, из которых пользователи могут выбирать; эти аватары смогут говорить на разных языках и иметь разные голоса в зависимости от информации, полученной от пользователей.
  • Пользовательские аватары с преобразованием текста в речь позволяют пользователям создавать свои собственные аватары. используя реальные изображения и видео. Система возьмет эти ресурсы и автоматически создаст аватар, соответствующий этим характеристикам. Важной особенностью является то, что система сделает аватар похожим на пользователя, если пользователь предоставит свой голос и внешний вид.

Несмотря на это, аватарам не хватает определенных выражений лица, из-за чего они выглядят довольно роботизированными.

Давайте возьмем два видеопримера, которые Microsoft разместила в своем блоге о своих продуктах. Оба создаются с использованием аватара преобразования текста в речь Azure. Первый из них, как вы можете видеть ниже, содержит аватар, демонстрирующий, как пользователи могут создавать видеоконтент с помощью аватаров Azure.

По миниатюре YouTube нельзя сказать, что модель, представленная в видео, на самом деле является аватаром, но как только вы воспроизводите видео, становится ясно, что оно полностью создано искусственным интеллектом. Синхронизация мимики аватара и его голоса несколько странная.

Технология преобразования текста в речь Azure позволяет создавать интерактивные аватары (второй пример). что демонстрирует ощущение жуткой долины (что-то, что действует как человеческая личность, но это не человек).

Как заявляет Microsoft, интерактивные аватары используют модель Azure OpenAI Service GPT-3.5 для ответа на запросы клиентов, включая устные диалоги с клиентами на разных языках. Уже одно это делает его невероятно полезным, но, опять же, взаимодействие выглядит искусственным и лишенным какого-либо человеческого взаимодействия, что может кого-то беспокоить.

Посмотрите здесь:

Со временем Microsoft может решить эту проблему, а с появлением новых технологий искусственного интеллекта технологический гигант из Редмонда сможет превратить аватар Azure в универсальный инструмент. Почему? Потому что компаниям уже нравится этот инструмент.

Мы используем Azure AI Services для нашего AI Banking Avatar благодаря уникальному сочетанию передовых услуг искусственного интеллекта и визуализации на одной платформе. Используя различные речевые аватары Azure AI, мы сможем обеспечить новый уровень обслуживания клиентов и действительно упростить банковское и банковское взаимодействие.

Джеральд Эртл, управляющий директор Commerzbank AG

Однако Microsoft не учла взаимодействие клиентов с этими аватарами. Хотя они могут быть гораздо более дешевым вариантом для компаний (и более быстрым), маркетолог должен иметь возможность создавать обучающих программ, не прибегая к внешним источникам), отсутствие каких-либо осмысленных физических выражений делает эти аватары похожими на роботы.

Искусственный интеллект нельзя игнорировать, особенно если мы говорим о таких инструментах, как Copilot на Windows 11 или Майкрософт 365, но когда он хочет походить на людей, это может стать довольно жутким.

Microsoft доработает эти аватары, в этом нет никаких сомнений, но на данный момент у меня по спине каждый раз, когда я смотрю на одного из них, возникает чувство, насильно ухмыляющееся или вообще ничего не выражающее.

Что вы думаете об этих аватарах?

Microsoft HoloLens 3 может наконец выйти в 2024 году

Microsoft HoloLens 3 может наконец выйти в 2024 годуHololensMicrosoft

Новый HoloLens 3 может выиграть от Windows Copilot.Новый патент на гарнитуру Microsoft может стать подсказкой для HoloLens 3.По его словам, новая гарнитура очень удобна в использовании.Если это Hol...

Читать далее
Microsoft Project Rumi AI может интерпретировать ваши выражения

Microsoft Project Rumi AI может интерпретировать ваши выраженияMicrosoft

Проект Руми способен на человеческие ответы. Project Rumi объединяет ваши физические выражения, чтобы составить мнение о ваших предложениях.Язык ИИ ответит вам в соответствии с вашим отношением. Pr...

Читать далее
Вы можете быстро создать собственный ИИ с помощью Microsoft Guidance.

Вы можете быстро создать собственный ИИ с помощью Microsoft Guidance.MicrosoftMicrosoft лазурный

Там, где нет руководства, модель не работает, но в изобилии инструкций есть безопасность.Microsoft Guidance — это язык, предназначенный для предоставления вам ясного синтаксиса при создании вашего ...

Читать далее