Microsoft tuto technologii určitě vylepší, je čas, aby byla lidštější.
![azurový avatar převodu textu na řeč](/f/4446445bfaac39c9379f6a536cfd7289.jpg)
Společnost Microsoft oznámila vydání avatara pro převod textu na řeč Azure na konferenci Microsoft Ignite konference, která se koná v Seattlu od 14. do 17. listopadu 2023. Avatar Azure je nyní ve veřejném náhledu a uživatelé Azure kdekoli si mohou vytvořit svého avatara pouze pomocí textových vstupů.
S potěšením oznamujeme vydání veřejné ukázky řeč Azure AI text to speech avatar, nová funkce, která uživatelům umožňuje vytvářet mluvící videa s avatary s textovým vstupem a vytvářet interaktivní roboty v reálném čase trénované pomocí lidských obrázků.
Microsoft
Technologický gigant se sídlem v Redmondu si myslí, že avatar pro převod textu na řeč Azure by mohl být vhodným řešením v boji tradiční tvorba videoobsahu a malé společnosti, jako jsou startupy, by z toho mohly velmi těžit nástroj.
Tradiční tvorba videoobsahu vyžaduje spoustu času a rozpočtu, včetně nastavení prostředí pro natáčení videa, natáčení videí, střihu atd. S avatarem převodu textu na řeč mohou uživatelé efektivněji vytvářet video. Uživatelé mohou pomocí avatara vytvářet školicí videa, představení produktů, posudky zákazníků atd., a to jednoduše pomocí textového vstupu.
Microsoft
Avatar převodu textu na řeč lze použít pro různé aplikace:
- Chatbot pro web o cestování
- Virtuální prodej v živé reklamě
- Učitel umělé inteligence, který vyučuje online a umí odpovídat na otázky
- Virtuální HR, který odpovídá na dotazy zaměstnanců
I když tento nástroj bude pro mnoho společností docela užitečný, může také generovat videa, která jaksi postrádají celé spektrum lidských výrazů. Zde je důvod:
Avatar pro převod textu na řeč Azure by mohl být užitečný, ale nezdá se, že by byl skutečný
Je důležité vědět, že Microsoft nabízí 2 způsoby generování avatara:
- Předpřipravené avatary převodu textu na řeč, přičemž Microsoft poskytuje seznam možností, ze kterých si uživatelé mohou vybrat; tito avataři budou moci mluvit různými jazyky a mít různé hlasy na základě vstupu od uživatelů.
- Vlastní avatary převodu textu na řeč umožňují uživatelům vytvářet vlastní avatary pomocí skutečných obrázků a videí. Systém vezme tyto zdroje a automaticky vytvoří avatara, který odpovídá těmto charakteristikám. Důležitou vlastností je, že systém vytvoří avatara, který se bude podobat uživateli, pokud uživatel poskytne svůj hlas a vzhled.
I tak ale avatarům chybí určité výrazy, díky čemuž vypadají docela roboticky.
Vezměme si 2 příklady videí, které Microsoft zveřejnil na svém blogu o produktech. Oba se generují pomocí avatara převodu textu na řeč v Azure. První, jak vidíte níže, obsahuje avatara, který ukazuje, jak mohou uživatelé generovat videoobsah pomocí Azure avatarů.
Z miniatury YouTube nemůžete poznat, že model prezentovaný ve videu je ve skutečnosti avatar, ale jakmile si video přehrajete, je jasné, že je zcela vytvořeno AI. Synchronizace mezi výrazy obličeje avatara a jejich hlasem je poněkud zvláštní.
Technologie Azure text-to-speech avatarů umožňuje vytváření interaktivních avatarů, druhý příklad který předvádí pocit tajemného údolí (něco, co působí jako lidská osoba, ale není člověk).
Jak říká Microsoft, interaktivní avataři využívají model Azure OpenAI Service GPT-3.5 k odpovědi na dotazy zákazníků, včetně verbálních dialogů se zákazníky v různých jazycích. Už jen díky tomu je neuvěřitelně užitečná, ale opět interakce vypadá uměle a postrádá jakoukoli lidskou interakci, což by pro některé mohlo být rušivé.
Podívejte se sem:
Časem by Microsoft mohl tento problém vyřešit a s novými technologiemi umělé inteligence by technický gigant se sídlem v Redmondu mohl přeměnit avatara Azure na nástroj, který lze používat v průmyslu. Proč? Protože společnosti již tento nástroj milují.
Azure AI Services používáme pro náš AI Banking Avatar díky jedinečné kombinaci špičkových služeb AI a vizualizace v jedné platformě. Použitím různých avatarů řeči převodu textu na řeč Azure AI budeme schopni vytvořit zákaznickou zkušenost nové úrovně a skutečně zjednodušit bankovní a bankovní interakce.
Gerald Ertl, generální ředitel, Commerzbank AG
Microsoft však nebral v úvahu interakce zákazníků s těmito avatary. I když by pro společnosti mohly být mnohem levnější možností (a také rychlejší, obchodník by měl být schopen vytvořit umělou inteligenci tutoriály bez použití externích zdrojů), nedostatek jakýchkoli smysluplných fyzických výrazů způsobuje, že tyto avatary vypadají robotů.
Umělou inteligenci nelze ignorovat, zvláště pokud mluvíme o nástrojích, jako je Copilot Windows 11 nebo Microsoft 365, ale když se chce podobat lidem, mohlo by to být docela záhadné.
Microsoft tyto avatary zdokonalí, o tom není pochyb, ale zatím mám pocit, že pokaždé, když se na jednoho z nich podívám, mám pocit, že se silně šklebím nebo nemám vůbec žádný výraz.
Co si myslíte o těchto avatarech?