Microsoft наверняка усовершенствует эту технологию, пришло время сделать ее более человечной.

Microsoft объявила о выпуске аватара Azure для преобразования текста в речь на конференции Microsoft Ignite конференция пройдет в Сиэтле с 14 по 17 ноября 2023 года. Аватар Azure теперь находится в общедоступной предварительной версии, и пользователи Azure во всем мире могут создавать свои аватары только с помощью текстового ввода.
Мы рады объявить о выпуске общедоступной предварительной версии Речь Azure AI преобразование текста в речь аватара — новая функция, которая позволяет пользователям создавать видеоролики с говорящими аватарами с вводом текста, а также создавать интерактивных ботов, работающих в реальном времени, обученных с использованием изображений людей.
Майкрософт
Технический гигант из Редмонда считает, что аватар Azure, преобразующий текст в речь, может стать подходящим решением для борьбы с традиционное создание видеоконтента, и небольшие компании, такие как стартапы, могут получить большую выгоду от такого инструмент.
Традиционное создание видеоконтента требует много времени и бюджета, включая настройку среды видеосъемки, съемку видеороликов, монтаж и т. д. С помощью аватара, преобразующего текст в речь, пользователи могут более эффективно создавать видео. Пользователи могут использовать аватар для создания обучающих видеороликов, презентаций продуктов, отзывов клиентов и т. д., просто вводя текст.
Майкрософт
Аватар преобразования текста в речь можно использовать для различных приложений:
- Чат-бот для туристического сайта
- Виртуальные продажи в живой рекламе
- Учитель искусственного интеллекта, который преподает онлайн и может отвечать на вопросы
- Виртуальный HR для ответа на вопросы сотрудников
Хотя этот инструмент будет весьма полезен для многих компаний, он также может создавать видеоролики, в которых почему-то отсутствует полный спектр человеческих выражений. Вот почему:
Аватар Azure с функцией преобразования текста в речь может быть полезен, но он не кажется реальным
Важно знать, что Microsoft предлагает 2 способа создания аватара:
- Готовые аватары для преобразования текста в речь, при этом Microsoft предоставляет список опций, из которых пользователи могут выбирать; эти аватары смогут говорить на разных языках и иметь разные голоса в зависимости от информации, полученной от пользователей.
- Пользовательские аватары с преобразованием текста в речь позволяют пользователям создавать свои собственные аватары. используя реальные изображения и видео. Система возьмет эти ресурсы и автоматически создаст аватар, соответствующий этим характеристикам. Важной особенностью является то, что система сделает аватар похожим на пользователя, если пользователь предоставит свой голос и внешний вид.
Несмотря на это, аватарам не хватает определенных выражений лица, из-за чего они выглядят довольно роботизированными.
Давайте возьмем два видеопримера, которые Microsoft разместила в своем блоге о своих продуктах. Оба создаются с использованием аватара преобразования текста в речь Azure. Первый из них, как вы можете видеть ниже, содержит аватар, демонстрирующий, как пользователи могут создавать видеоконтент с помощью аватаров Azure.
По миниатюре YouTube нельзя сказать, что модель, представленная в видео, на самом деле является аватаром, но как только вы воспроизводите видео, становится ясно, что оно полностью создано искусственным интеллектом. Синхронизация мимики аватара и его голоса несколько странная.
Технология преобразования текста в речь Azure позволяет создавать интерактивные аватары (второй пример). что демонстрирует ощущение жуткой долины (что-то, что действует как человеческая личность, но это не человек).
Как заявляет Microsoft, интерактивные аватары используют модель Azure OpenAI Service GPT-3.5 для ответа на запросы клиентов, включая устные диалоги с клиентами на разных языках. Уже одно это делает его невероятно полезным, но, опять же, взаимодействие выглядит искусственным и лишенным какого-либо человеческого взаимодействия, что может кого-то беспокоить.
Посмотрите здесь:
Со временем Microsoft может решить эту проблему, а с появлением новых технологий искусственного интеллекта технологический гигант из Редмонда сможет превратить аватар Azure в универсальный инструмент. Почему? Потому что компаниям уже нравится этот инструмент.
Мы используем Azure AI Services для нашего AI Banking Avatar благодаря уникальному сочетанию передовых услуг искусственного интеллекта и визуализации на одной платформе. Используя различные речевые аватары Azure AI, мы сможем обеспечить новый уровень обслуживания клиентов и действительно упростить банковское и банковское взаимодействие.
Джеральд Эртл, управляющий директор Commerzbank AG
Однако Microsoft не учла взаимодействие клиентов с этими аватарами. Хотя они могут быть гораздо более дешевым вариантом для компаний (и более быстрым), маркетолог должен иметь возможность создавать обучающих программ, не прибегая к внешним источникам), отсутствие каких-либо осмысленных физических выражений делает эти аватары похожими на роботы.
Искусственный интеллект нельзя игнорировать, особенно если мы говорим о таких инструментах, как Copilot на Windows 11 или Майкрософт 365, но когда он хочет походить на людей, это может стать довольно жутким.
Microsoft доработает эти аватары, в этом нет никаких сомнений, но на данный момент у меня по спине каждый раз, когда я смотрю на одного из них, возникает чувство, насильно ухмыляющееся или вообще ничего не выражающее.
Что вы думаете об этих аватарах?