Microsoft със сигурност ще усъвършенства технологията, време е да я направи по-човешка.

Microsoft обяви пускането на Azure аватар за текст в реч на Microsoft Ignite конференция, която се провежда в Сиатъл от 14 до 17 ноември 2023 г. Аватарът на Azure вече е в публичен преглед и потребителите на Azure навсякъде могат да създават своя аватар само с въвеждане на текст.
Ние сме развълнувани да обявим публичната предварителна версия на Реч на Azure AI аватар от текст към реч, нова функция, която позволява на потребителите да създават видеоклипове с говорещ аватар с въвеждане на текст и да създават интерактивни ботове в реално време, обучени да използват човешки изображения.
Microsoft
Базираният в Редмънд технологичен гигант смята, че аватарът за преобразуване на текст в реч на Azure може да бъде подходящо решение за борба с традиционно създаване на видео съдържание, а малките компании, като стартиращи компании, биха могли да се възползват значително от такова инструмент.
Традиционното създаване на видео съдържание изисква много време и бюджет, включително настройка на среда за видео заснемане, заснемане на видеоклипове, редактиране и т.н. С аватара от текст в реч потребителите могат по-ефективно да създават видео. Потребителите могат да използват аватара, за да създават видеоклипове за обучение, представяне на продукти, препоръки на клиенти и т.н., просто с въвеждане на текст.
Microsoft
Аватарът за синтезиран говор може да се използва за различни приложения:
- Чатбот за уебсайт за пътуване
- Виртуални продажби в реклама на живо
- Учител по изкуствен интелект, който преподава онлайн и може да отговаря на въпроси
- Виртуален HR, който да отговаря на въпросите на служителите
Въпреки че инструментът ще бъде доста полезен за много компании, той може също така да генерира видеоклипове, на които по някакъв начин липсва пълният спектър от човешки изрази. Ето защо:
Аватарът за синтезиран говор на Azure може да бъде полезен, но не изглежда истински
Важно е да знаете, че Microsoft предлага 2 начина за генериране на аватар:
- Предварително изградени аватари за синтезиран говор, като Microsoft предоставя списък с опции, от които потребителите могат да избират; тези аватари ще могат да говорят различни езици и да имат различни гласове въз основа на информацията, получена от потребителите.
- Персонализираните аватари за синтезиран говор позволяват на потребителите да създават свои персонализирани аватари използване на изображения и видеоклипове от реалния живот. Системата ще вземе тези ресурси и автоматично ще излезе с аватар, който отговаря на тези характеристики. Важна характеристика е, че системата ще накара аватара да прилича на потребителя, ако потребителят предостави своя глас и външен вид.
Въпреки това на аватарите липсват определени изрази, факт, който ги кара да изглеждат доста роботизирани.
Нека вземем 2 видео примера, публикувани от Microsoft в техния блог за продуктите. И двете се генерират с помощта на аватара за синтезиран говор на Azure. Първият, както можете да видите по-долу, включва аватар, показващ как потребителите могат да генерират видео съдържание с помощта на аватари на Azure.
От миниизображението в YouTube не можете да разберете, че моделът, представен във видеото, всъщност е аватар, но веднага щом пуснете видеоклипа, става ясно, че той е изцяло генериран от AI. Синхронизирането между изражението на лицето на аватара и гласа им е малко странно.
Технологията за преобразуване на аватар на Azure позволява изграждането на интерактивни аватари, вторият пример което демонстрира усещането за тайнствена долина (нещо, което действа като човешки човек, но не е човек).
Както казва Microsoft, интерактивните аватари използват модела Azure OpenAI Service GPT-3.5, за да отговарят на заявки на клиенти, включително вербални диалози с клиенти на различни езици. Само това го прави невероятно полезно, но отново взаимодействието изглежда изкуствено и лишено от каквото и да е човешко взаимодействие, което може да е обезпокоително за някои.
Разгледайте тук:
С течение на времето Microsoft може да реши този проблем и с появата на нови AI технологии, базираният в Редмънд технологичен гигант може да трансформира аватара на Azure в инструмент за индустрията. Защо? Тъй като компаниите вече обичат инструмента.
Ние използваме Azure AI Services за нашия AI Banking Avatar поради уникалната комбинация от водещи AI и услуги за визуализация в една платформа. Чрез използването на различни Azure AI Speech текст към реч аватар ще можем да генерираме потребителско изживяване от следващо ниво и наистина да опростим банкирането и банковите взаимодействия.
Джералд Ертл, управляващ директор, Commerzbank AG
Microsoft обаче не е взела под внимание взаимодействието на клиентите с тези аватари. Въпреки че те биха могли да бъдат много по-евтин вариант за компаниите (а също и по-бърз, търговецът трябва да може да създава генерирани от AI уроци, без да прибягвате до външни източници), липсата на каквито и да било смислени физически изрази прави тези аватари да изглеждат като роботи.
AI не може да бъде пренебрегнат, особено ако говорим за инструменти като Copilot on Windows 11 или Microsoft 365, но когато иска да прилича на хора, може да стане доста странно.
Microsoft ще усъвършенства тези аватари, няма съмнение в това, но засега всеки път, когато погледна някой от тях, има чувство, че се усмихва насила или няма никакво изражение.
Какво мислите за тези аватари?