Avatar pro převod textu na řeč Azure může rušit uživatele svými podivnými vlastnostmi údolí

Microsoft tuto technologii určitě vylepší, je čas, aby byla lidštější.

azurový avatar převodu textu na řeč

Společnost Microsoft oznámila vydání avatara pro převod textu na řeč Azure na konferenci Microsoft Ignite konference, která se koná v Seattlu od 14. do 17. listopadu 2023. Avatar Azure je nyní ve veřejném náhledu a uživatelé Azure kdekoli si mohou vytvořit svého avatara pouze pomocí textových vstupů.

S potěšením oznamujeme vydání veřejné ukázky řeč Azure AI text to speech avatar, nová funkce, která uživatelům umožňuje vytvářet mluvící videa s avatary s textovým vstupem a vytvářet interaktivní roboty v reálném čase trénované pomocí lidských obrázků.

Microsoft

Technologický gigant se sídlem v Redmondu si myslí, že avatar pro převod textu na řeč Azure by mohl být vhodným řešením v boji tradiční tvorba videoobsahu a malé společnosti, jako jsou startupy, by z toho mohly velmi těžit nástroj.

Tradiční tvorba videoobsahu vyžaduje spoustu času a rozpočtu, včetně nastavení prostředí pro natáčení videa, natáčení videí, střihu atd. S avatarem převodu textu na řeč mohou uživatelé efektivněji vytvářet video. Uživatelé mohou pomocí avatara vytvářet školicí videa, představení produktů, posudky zákazníků atd., a to jednoduše pomocí textového vstupu.

Microsoft

Avatar převodu textu na řeč lze použít pro různé aplikace:

  • Chatbot pro web o cestování
  • Virtuální prodej v živé reklamě
  • Učitel umělé inteligence, který vyučuje online a umí odpovídat na otázky
  • Virtuální HR, který odpovídá na dotazy zaměstnanců

I když tento nástroj bude pro mnoho společností docela užitečný, může také generovat videa, která jaksi postrádají celé spektrum lidských výrazů. Zde je důvod:

Avatar pro převod textu na řeč Azure by mohl být užitečný, ale nezdá se, že by byl skutečný

Je důležité vědět, že Microsoft nabízí 2 způsoby generování avatara:

  • Předpřipravené avatary převodu textu na řeč, přičemž Microsoft poskytuje seznam možností, ze kterých si uživatelé mohou vybrat; tito avataři budou moci mluvit různými jazyky a mít různé hlasy na základě vstupu od uživatelů.
  • Vlastní avatary převodu textu na řeč umožňují uživatelům vytvářet vlastní avatary pomocí skutečných obrázků a videí. Systém vezme tyto zdroje a automaticky vytvoří avatara, který odpovídá těmto charakteristikám. Důležitou vlastností je, že systém vytvoří avatara, který se bude podobat uživateli, pokud uživatel poskytne svůj hlas a vzhled.

I tak ale avatarům chybí určité výrazy, díky čemuž vypadají docela roboticky.

Vezměme si 2 příklady videí, které Microsoft zveřejnil na svém blogu o produktech. Oba se generují pomocí avatara převodu textu na řeč v Azure. První, jak vidíte níže, obsahuje avatara, který ukazuje, jak mohou uživatelé generovat videoobsah pomocí Azure avatarů.

Z miniatury YouTube nemůžete poznat, že model prezentovaný ve videu je ve skutečnosti avatar, ale jakmile si video přehrajete, je jasné, že je zcela vytvořeno AI. Synchronizace mezi výrazy obličeje avatara a jejich hlasem je poněkud zvláštní.

Technologie Azure text-to-speech avatarů umožňuje vytváření interaktivních avatarů, druhý příklad který předvádí pocit tajemného údolí (něco, co působí jako lidská osoba, ale není člověk).

Jak říká Microsoft, interaktivní avataři využívají model Azure OpenAI Service GPT-3.5 k odpovědi na dotazy zákazníků, včetně verbálních dialogů se zákazníky v různých jazycích. Už jen díky tomu je neuvěřitelně užitečná, ale opět interakce vypadá uměle a postrádá jakoukoli lidskou interakci, což by pro některé mohlo být rušivé.

Podívejte se sem:

Časem by Microsoft mohl tento problém vyřešit a s novými technologiemi umělé inteligence by technický gigant se sídlem v Redmondu mohl přeměnit avatara Azure na nástroj, který lze používat v průmyslu. Proč? Protože společnosti již tento nástroj milují.

Azure AI Services používáme pro náš AI Banking Avatar díky jedinečné kombinaci špičkových služeb AI a vizualizace v jedné platformě. Použitím různých avatarů řeči převodu textu na řeč Azure AI budeme schopni vytvořit zákaznickou zkušenost nové úrovně a skutečně zjednodušit bankovní a bankovní interakce.

Gerald Ertl, generální ředitel, Commerzbank AG

Microsoft však nebral v úvahu interakce zákazníků s těmito avatary. I když by pro společnosti mohly být mnohem levnější možností (a také rychlejší, obchodník by měl být schopen vytvořit umělou inteligenci tutoriály bez použití externích zdrojů), nedostatek jakýchkoli smysluplných fyzických výrazů způsobuje, že tyto avatary vypadají robotů.

Umělou inteligenci nelze ignorovat, zvláště pokud mluvíme o nástrojích, jako je Copilot Windows 11 nebo Microsoft 365, ale když se chce podobat lidem, mohlo by to být docela záhadné.

Microsoft tyto avatary zdokonalí, o tom není pochyb, ale zatím mám pocit, že pokaždé, když se na jednoho z nich podívám, mám pocit, že se silně šklebím nebo nemám vůbec žádný výraz.

Co si myslíte o těchto avatarech?

Americko-čínská technologická válka poškozuje ekonomický růst, říká generální ředitel společnosti Microsoft

Americko-čínská technologická válka poškozuje ekonomický růst, říká generální ředitel společnosti MicrosoftMicrosoft

Ve světě technologií jsou po nějakou dobu v čele USA a Čína. Vzhledem k tomu, že každý den se objevuje stále více společností, obě země si prozatím ponechají své místo.Nedůvěra mezi USA a Čínou och...

Přečtěte si více
Microsoft zlepšuje akvizici cloudu akvizicí Movere

Microsoft zlepšuje akvizici cloudu akvizicí MovereMicrosoftBlankyt

Společnost Microsoft dnes získala Movere, poskytovatele cloudové migrace.Movere, dříve známý jako Unified Logic již nějakou dobu působí v cloudovém migračním prostoru a poskytuje inovativní technol...

Přečtěte si více
Microsoft zakládá svou vlastní charitativní organizaci Microsoft Philanthropies

Microsoft zakládá svou vlastní charitativní organizaci Microsoft PhilanthropiesMicrosoftVýběr Redakce

Bill Gates je známý jako velký filantrop a nyní se k charitativní činnosti zaváže i jeho vlastní společnost. Společnost Microsoft plánuje rozšířit pohledy na humanitární práci spuštěním nové organi...

Přečtěte si více