Мицрософт ће сигурно побољшати технологију, време је да је учини људскијом.
Мицрософт је најавио издавање Азуре аватара за претварање текста у говор на Мицрософт Игните конференција која се одржава у Сијетлу од 14. до 17. новембра 2023. Азуре аватар је сада у јавном прегледу, а Азуре корисници свуда могу да направе свој аватар само помоћу уноса текста.
Узбуђени смо што можемо најавити јавну претпрегледну верзију Азуре АИ говор аватар текст у говор, нова функција која омогућава корисницима да креирају видео снимке аватара који говоре са уносом текста и да граде интерактивне ботове у реалном времену обучене помоћу људских слика.
Мицрософт
Технолошки гигант са седиштем у Редмонду мисли да би Азуре аватар за претварање текста у говор могао бити прикладно решење за борбу традиционално креирање видео садржаја, а мале компаније, попут стартапа, могле би имати велике користи од тога оруђе.
Традиционално креирање видео садржаја захтева много времена и буџета, укључујући подешавање окружења за снимање видео записа, снимање видео записа, монтажу итд. Са аватаром из текста у говор, корисници могу ефикасније да креирају видео. Корисници могу да користе аватар за прављење видео записа за обуку, представљања производа, изјава купаца итд., једноставним уносом текста.
Мицрософт
Аватар за претварање текста у говор се може користити за различите апликације:
- Цхатбот за веб локацију за путовања
- Виртуелна продаја у реклами уживо
- АИ наставник који предаје онлајн и може да одговори на питања
- Виртуелни ХР који одговара на питања запослених
Иако ће алат бити прилично користан за многе компаније, такође може да генерише видео записе којима на неки начин недостаје читав спектар људских израза. Ево зашто:
Азуре аватар за претварање текста у говор би могао бити користан, али се не чини стварним
Важно је знати да Мицрософт нуди 2 начина за генерисање аватара:
- Унапред изграђени аватари за претварање текста у говор, при чему Мицрософт обезбеђује листу опција које корисници могу да бирају; ови аватари ће моћи да говоре различите језике и да имају различите гласове на основу уноса примљених од корисника.
- Прилагођени аватари за претварање текста у говор омогућавају корисницима да направе своје прилагођене аватаре користећи слике и видео записе из стварног живота. Систем ће узети те ресурсе и аутоматски ће осмислити аватар који одговара тим карактеристикама. Важна карактеристика је да ће систем учинити да аватар личи на корисника ако корисник пружи свој глас и изглед.
Чак и тако, аватарима недостају одређени изрази, што их чини прилично роботским.
Узмимо 2 видео примера које је Мицрософт објавио на свом блог посту о производима. Оба се генеришу помоћу Азуре аватара за претварање текста у говор. Први, као што можете видети у наставку, садржи аватар који приказује како корисници могу да генеришу видео садржај користећи Азуре аватаре.
Из ИоуТубе сличице не можете да кажете да је модел представљен у видеу заправо аватар, али чим пустите видео, постаје јасно да је у потпуности генерисан вештачком интелигенцијом. Синхронизација између аватарових израза лица и њиховог гласа је помало чудна.
Азуре технологија аватара за претварање текста у говор омогућава прављење интерактивних аватара, други пример који приказује осећај чудесне долине (нешто што делује као људска особа, али није људски).
Како Мицрософт каже, интерактивни аватари користе Азуре ОпенАИ Сервице ГПТ-3.5 модел да одговоре на упите купаца, укључујући вербалне дијалоге са клијентима на различитим језицима. Само ово га чини невероватно корисним, али опет, интеракција изгледа вештачка и лишена било какве људске интеракције, што би за неке могло бити узнемирујуће.
погледајте овде:
Временом би Мицрософт могао да реши овај проблем, а са појавом нових технологија вештачке интелигенције, технолошки гигант са седиштем у Редмонду могао би да трансформише Азуре аватар у индустријски алат. Зашто? Зато што компаније већ воле овај алат.
Користимо Азуре АИ услуге за наш АИ Банкинг Аватар због јединствене комбинације врхунских АИ и услуга визуелизације у једној платформи. Коришћењем различитих Азуре АИ говорних аватара из текста у говор моћи ћемо да генеришемо корисничко искуство следећег нивоа и заиста поједноставимо банкарске и банкарске интеракције.
Гералд Ертл, генерални директор, Цоммерзбанк АГ
Међутим, Мицрософт није узео у обзир интеракције купаца са овим аватарима. Иако би могли бити много јефтинија опција за компаније (и бржи, маркетиншки стручњак би требао бити у могућности да креира АИ-генерацију туторијали без прибегавања спољним изворима), недостатак било каквих смислених физичких израза чини да ови аватари изгледају као роботи.
АИ се не може занемарити, посебно ако говоримо о алатима као што је Цопилот Виндовс 11 или Мицрософт 365, али када пожели да личи на људе, могло би да постане прилично језиво.
Мајкрософт ће усавршити ове аватаре, нема сумње у то, али за сада имам осећај низ кичму сваки пут када погледам неког од њих, насилно се церекам или уопште немам израз.
Шта мислите о овим аватарима?