Microsoft bo zagotovo izboljšal tehnologijo, čas je, da postane bolj človeška.
Microsoft je napovedal izdajo avatarja Azure za pretvorbo besedila v govor na Microsoft Ignite konferenca, ki bo potekala v Seattlu od 14. do 17. novembra 2023. Avatar Azure je zdaj v javnem predogledu in uporabniki Azure povsod lahko ustvarijo svoj avatar samo z vnosom besedila.
Z veseljem objavljamo javno predogledno izdajo Azure AI Speech avatar besedilo v govor, nova funkcija, ki uporabnikom omogoča ustvarjanje videoposnetkov govorečih avatarjev z vnosom besedila in ustvarjanje interaktivnih botov v realnem času, usposobljenih za uporabo človeških slik.
Microsoft
Tehnološki velikan s sedežem v Redmondu meni, da bi lahko bil avatar Azure za pretvorbo besedila v govor primerna rešitev za boj proti tradicionalno ustvarjanje video vsebin, mala podjetja, kot so startupi, pa bi lahko imela veliko koristi od tega orodje.
Tradicionalno ustvarjanje video vsebin zahteva veliko časa in proračuna, vključno z nastavitvijo okolja za snemanje videa, snemanjem videov, montažo itd. Z avatarjem besedila v govor lahko uporabniki učinkoviteje ustvarjajo video. Uporabniki lahko uporabljajo avatar za ustvarjanje videoposnetkov za usposabljanje, predstavitev izdelkov, izjav strank itd., preprosto z vnosom besedila.
Microsoft
Avatar pretvorbe besedila v govor se lahko uporablja za različne aplikacije:
- Klepetalni robot za potovalno spletno mesto
- Virtualna prodaja v reklami v živo
- Učitelj AI, ki poučuje na spletu in zna odgovarjati na vprašanja
- Virtualni HR, ki odgovarja na vprašanja zaposlenih
Medtem ko bo orodje precej uporabno za številna podjetja, lahko ustvari tudi videoposnetke, ki jim nekako manjka celoten spekter človeških izrazov. Evo zakaj:
Avatar Azure za pretvorbo besedila v govor bi lahko bil koristen, vendar se ne zdi resničen
Pomembno je vedeti, da Microsoft ponuja 2 načina za ustvarjanje avatarja:
- Vnaprej pripravljeni avatarji za pretvorbo besedila v govor, pri čemer Microsoft ponuja seznam možnosti, med katerimi lahko uporabniki izbirajo; ti avatarji bodo lahko govorili različne jezike in imeli različne glasove glede na vnos uporabnikov.
- Avatarji za pretvorbo besedila v govor po meri uporabnikom omogočajo izdelavo lastnih avatarjev z uporabo slik in videoposnetkov iz resničnega življenja. Sistem bo vzel ta sredstva in samodejno prikazal avatar, ki ustreza tem značilnostim. Pomembna lastnost je, da sistem naredi avatar, ki je podoben uporabniku, če uporabnik zagotovi svoj glas in videz.
Kljub temu avatarjem manjkajo določeni izrazi, zaradi česar so videti precej robotizirani.
Vzemimo 2 video primera, ki jih je Microsoft objavil v svojem spletnem dnevniku o izdelkih. Oba sta ustvarjena z uporabo avatarja Azure za pretvorbo besedila v govor. Prvi, kot lahko vidite spodaj, vsebuje avatar, ki prikazuje, kako lahko uporabniki ustvarijo video vsebino z uporabo avatarjev Azure.
Iz YouTubove sličice ne morete razbrati, da je model, predstavljen v videoposnetku, dejansko avatar, a takoj, ko predvajate video, postane jasno, da je v celoti ustvarjen z umetno inteligenco. Sinhronizacija med obrazno mimiko avatarja in njihovim glasom je nekoliko čudna.
Tehnologija avatarjev besedila v govor Azure omogoča izdelavo interaktivnih avatarjev, drugi primer ki prikazuje občutek čudaške doline (nekaj, kar deluje kot človeška oseba, vendar ni človek).
Kot pravi Microsoft, interaktivni avatarji uporabljajo model Azure OpenAI Service GPT-3.5 za odgovarjanje na poizvedbe strank, vključno z besednimi pogovori s strankami v različnih jezikih. Že samo zaradi tega je neverjetno uporaben, toda spet je interakcija videti umetna in brez kakršne koli človeške interakcije, kar bi lahko za nekatere bilo moteče.
Oglejte si tukaj:
Sčasoma bi Microsoft morda rešil to težavo in z novimi tehnologijami umetne inteligence, ki se pojavljajo, bi lahko tehnološki velikan s sedežem v Redmondu spremenil avatar Azure v industrijsko orodje za uporabo. Zakaj? Ker podjetja že obožujejo orodje.
Za naš AI Banking Avatar uporabljamo storitve Azure AI zaradi edinstvene kombinacije vrhunskih AI in storitev vizualizacije na eni platformi. Z uporabo različnih govornih avatarjev Azure AI Speech bomo lahko ustvarili višjo raven uporabniške izkušnje in resnično poenostavili bančništvo in bančne interakcije.
Gerald Ertl, generalni direktor, Commerzbank AG
Vendar Microsoft ni upošteval interakcij strank s temi avatarji. Čeprav so lahko veliko cenejša možnost za podjetja (in tudi hitrejša, bi moral biti tržnik sposoben ustvariti umetno inteligenco vadnice brez uporabe zunanjih virov), zaradi pomanjkanja kakršnih koli smiselnih fizičnih izrazov so ti avatarji videti kot roboti.
Umetne inteligence ni mogoče prezreti, še posebej, če govorimo o orodjih, kot je Copilot on Windows 11 oz Microsoft 365, ko pa hoče biti podoben ljudem, lahko postane precej nenavadno.
Microsoft bo te avatarje dodelal, o tem ni dvoma, a zaenkrat me vsakič, ko pogledam katerega od njih, prešine občutek, da se močno smeje ali da nima izraza.
Kaj menite o teh avatarjih?