Az Azure szövegfelolvasó avatarja zavarhatja a felhasználókat a rejtélyes völgy jellemzőivel

A Microsoft minden bizonnyal finomítani fogja a technológiát, ideje emberibbé tenni.

azúrkék szövegből beszéd avatar

A Microsoft bejelentette az Azure text-to-speech avatar kiadását a Microsoft Ignite konferencia Seattle-ben, 2023. november 14. és 17. között. Az Azure-avatar most nyilvános előnézetben van, és az Azure-felhasználók mindenhol csak szövegbevitellel hozhatják létre avatarjukat.

Örömmel jelentjük be a nyilvános előzetes megjelenését Azure AI Speech text to beszéd avatar, egy új funkció, amely lehetővé teszi a felhasználók számára, hogy szövegbevitellel beszélő avatarvideókat készítsenek, és valós idejű interaktív robotokat építsenek emberi képek felhasználásával.

Microsoft

A redmondi technológiai óriás úgy gondolja, hogy az Azure szövegfelolvasó avatarja megfelelő megoldás lehet a hagyományos videótartalom-készítés, és a kis cégek, mint például a startupok, nagy hasznot húzhatnának az ilyen eszköz.

A hagyományos videotartalom-készítés sok időt és költségvetést igényel, beleértve a videófelvételi környezet beállítását, a videók filmezését, a szerkesztést stb. A szöveg-beszéd avatar segítségével a felhasználók hatékonyabban készíthetnek videót. A felhasználók az avatart segítségével oktatóvideókat, termékbemutatókat, vásárlói beszámolókat stb. készíthetnek, egyszerűen szövegbevitellel.

Microsoft

A szöveg-beszéd avatar különféle alkalmazásokhoz használható:

  • Chatbot egy utazási weboldalhoz
  • Virtuális értékesítés élő reklámban
  • AI tanár, aki online tanít, és válaszol a kérdésekre
  • Virtuális HR az alkalmazottak kérdéseinek megválaszolásához

Bár az eszköz nagyon hasznos lesz sok vállalat számára, olyan videókat is generálhat, amelyekből valahogy hiányzik az emberi megnyilvánulások teljes spektruma. Íme, miért:

Az Azure szövegfelolvasó avatarja hasznos lehet, de nem tűnik igazinak

Fontos tudni, hogy a Microsoft 2 módot kínál az avatar létrehozására:

  • Előre elkészített szövegfelolvasó avatarok, a Microsoft segítségével a felhasználók választhatnak a lehetőségek közül; ezek az avatarok különböző nyelveken tudnak majd beszélni, és különböző hangjuk lesz a felhasználóktól kapott bemenet alapján.
  • Az egyéni szövegfelolvasó avatarok lehetővé teszik a felhasználók számára, hogy személyre szabott avatarokat készítsenek valós képek és videók segítségével. A rendszer felveszi ezeket az erőforrásokat, és automatikusan előáll egy avatárral, amely megfelel ezeknek a jellemzőknek. Fontos jellemzője, hogy a rendszer a felhasználóhoz hasonló avatárt készít, ha a felhasználó megadja a hangját és megjelenését.

Ennek ellenére az avatarokból hiányoznak bizonyos kifejezések, amitől egészen robotikusnak tűnnek.

Vegyük azt a 2 videopéldát, amelyet a Microsoft tett közzé a termékekről szóló blogbejegyzésében. Mindkettő az Azure szövegfelolvasó avatarjával jön létre. Az első, amint az alábbiakban látható, egy avatárt tartalmaz, amely bemutatja, hogy a felhasználók hogyan hozhatnak létre videotartalmat az Azure-avatarok használatával.

A YouTube bélyegképéből nem derül ki, hogy a videóban bemutatott modell valójában egy avatar, de a videó lejátszásakor világossá válik, hogy teljes mértékben mesterséges intelligencia által generált. Az avatar arckifejezése és hangja közötti szinkronizálás kissé furcsa.

Az Azure szövegfelolvasó avatartechnológiája lehetővé teszi interaktív avatarok létrehozását, a második példa ami bemutatja a rejtélyes völgy érzését (valami olyasmi, ami emberként viselkedik, de nem az emberi).

Ahogy a Microsoft mondja, az interaktív avatárok az Azure OpenAI Service GPT-3.5 modelljét használják az ügyfelek kérdéseire való válaszadásra, beleértve a különböző nyelveken folytatott szóbeli párbeszédeket is. Ez önmagában hihetetlenül hasznossá teszi, de az interakció mesterségesnek tűnik, és mentes minden emberi interakciótól, ami egyesek számára zavaró lehet.

Nézz be ide:

Idővel a Microsoft megoldhatja ezt a problémát, és az új mesterséges intelligencia-technológiák megjelenésével a redmondi technológiai óriás az Azure-avatart egy iparágban használható eszközzé alakíthatja. Miért? Mert a cégek már szeretik az eszközt.

Az Azure AI Services szolgáltatást használjuk AI Banking Avatarunkhoz, a csúcstechnológiájú mesterséges intelligencia és a vizualizációs szolgáltatások egyetlen platformon belüli egyedülálló kombinációja miatt. Különböző Azure AI beszédszöveg-beszéd avatarok használatával új szintű ügyfélélményt tudunk létrehozni, és valóban leegyszerűsítjük a banki és banki interakciókat.

Gerald Ertl, a Commerzbank AG ügyvezető igazgatója

A Microsoft azonban nem vette figyelembe az ügyfelek interakcióit ezekkel az avatarokkal. Bár sokkal olcsóbb megoldás lehet a vállalatok számára (és gyorsabb is, egy marketingszakembernek képesnek kell lennie mesterséges intelligencia által generált oktatóanyagok külső források igénybevétele nélkül), az értelmes fizikai kifejezések hiánya miatt ezek az avatarok úgy néznek ki robotok.

Az AI nem hagyható figyelmen kívül, különösen, ha olyan eszközökről beszélünk, mint a Copilot on Windows 11 vagy Microsoft 365, de ha az emberhez akar hasonlítani, akkor egészen elképesztő lehet.

A Microsoft finomítani fogja ezeket az avatarokat, efelől nincs kétség, de egyelőre olyan érzés lesz a gerincemben, amikor ránézek valamelyikre, erőltetetten vigyorogva, vagy egyáltalán nincs arckifejezésem.

Mi a véleményed ezekről az avatarokról?

Hol lehet élőben nézni a Microsoft Surface 2 indító eseményét [frissítve]

Hol lehet élőben nézni a Microsoft Surface 2 indító eseményét [frissítve]Microsoft

Az Apple még nem adta ki az iPad 5-öt és a következő generációs iPad Mini 2-t, így a Microsoftnak jó esélyei vannak vihar által a piacot, ha az induláskor sikerül kiadniuk Surface táblagépének néhá...

Olvass tovább
A Microsoft 14 millió dollárt fizetett Sinofsky-nak, hogy egy évig munkanélküli legyen

A Microsoft 14 millió dollárt fizetett Sinofsky-nak, hogy egy évig munkanélküli legyenMicrosoft

Ha az utóbbi időben követte a Microsoft híreit, akkor tudja, hogy Steven Sinofsky lemondó a Microsofttól 2012. novemberben. De nem láttuk, hogy Sinofsky urat bárhol felvennék, igaz? Tudtuk, hogy am...

Olvass tovább
A WinUI 3 Preview 1 támogatja a Win32 alkalmazásokat és a .NET 5 interfészeket

A WinUI 3 Preview 1 támogatja a Win32 alkalmazásokat és a .NET 5 interfészeketMicrosoftA Microsoft 2020 As építése

A WinUI 3 Preview 1 már szállított, és támogatja a Win32 alkalmazásokat és további platformokat.Az előnézet tartalmazza a SwapChainPanel vezérlőt a kiváló grafika DirectX-sel történő szállításához....

Olvass tovább