Microsoft vil helt sikkert forfine teknologien, og det er på tide at gøre det mere menneskeligt.
Microsoft annoncerede udgivelsen af Azure tekst-til-tale-avataren på Microsoft Ignite konference, der finder sted i Seattle fra den 14. til den 17. november 2023. Azure-avataren er nu i offentlig forhåndsvisning, og Azure-brugere overalt kan kun bygge deres avatar med tekstinput.
Vi er glade for at kunne annoncere den offentlige forhåndsvisning af Azure AI-tale tekst til tale-avatar, en ny funktion, der gør det muligt for brugere at skabe talende avatar-videoer med tekstinput og at bygge interaktive bots i realtid, der trænes ved hjælp af menneskelige billeder.
Microsoft
Den Redmond-baserede teknologigigant mener, at Azure tekst-til-tale-avatar kan være en passende løsning at bekæmpe traditionel skabelse af videoindhold, og små virksomheder, såsom startups, kunne have stor gavn af en sådan værktøj.
Traditionel oprettelse af videoindhold kræver en masse tid og budget, herunder opsætning af videooptagelsesmiljø, optagelse af videoer, redigering osv. Med tekst til tale-avatar kan brugere mere effektivt oprette video. Brugere kan bruge avataren til at bygge træningsvideoer, produktintroduktioner, kundeudtalelser osv., blot med tekstinput.
Microsoft
Tekst-til-tale-avataren kan bruges til forskellige applikationer:
- En chatbot til en rejsehjemmeside
- Virtuelt salg i en live-reklame
- AI-lærer, der underviser online og kan svare på spørgsmål
- En virtuel HR til at svare på medarbejdernes spørgsmål
Selvom værktøjet vil være ret nyttigt for mange virksomheder, kan det også generere videoer, der på en eller anden måde mangler hele spektret af menneskelige udtryk. Her er hvorfor:
Azure tekst-til-tale-avataren kunne være nyttig, men den føles ikke ægte
Det er vigtigt at vide, at Microsoft tilbyder 2 måder at generere en avatar på:
- Forudbyggede tekst-til-tale-avatarer, hvor Microsoft leverer en liste over muligheder, som brugerne kan vælge imellem; disse avatarer vil være i stand til at tale forskellige sprog og have forskellige stemmer baseret på input modtaget fra brugere.
- Brugerdefinerede tekst-til-tale-avatarer gør det muligt for brugere at bygge deres tilpassede avatarer ved hjælp af billeder og videoer fra det virkelige liv. Systemet tager disse ressourcer og kommer automatisk med en avatar, der matcher disse egenskaber. En vigtig funktion er, at systemet vil få en avatar til at ligne brugeren, hvis brugeren giver deres stemme og udseende.
Alligevel mangler avatarerne visse udtryk, et faktum, der får dem til at se ret robotagtige ud.
Lad os tage de 2 videoeksempler Microsoft postede på deres blogindlæg om produkterne. Begge genereres ved hjælp af Azure tekst-til-tale-avatar. Den første, som du kan se nedenfor, har en avatar, der viser, hvordan brugere kan generere videoindhold ved hjælp af Azure-avatarer.
Fra YouTube-thumbnailet kan du ikke se, at modellen præsenteret i videoen faktisk er en avatar, men så snart du afspiller videoen, bliver det klart, at den udelukkende er AI-genereret. Synkroniseringen mellem avatarens ansigtsudtryk og deres stemme er noget mærkelig.
Azure tekst-til-tale avatar-teknologien gør det muligt at bygge interaktive avatarer, det andet eksempel der viser følelsen af en uhyggelig dal (noget, der fungerer som en menneskelig person, men det er ikke human).
Som Microsoft siger, bruger de interaktive avatarer Azure OpenAI Service GPT-3.5-modellen til at svare på kundeforespørgsler, herunder verbale dialoger med kunder på forskellige sprog. Alene dette gør det utroligt nyttigt, men igen ser interaktionen kunstig ud og blottet for enhver menneskelig interaktion, hvilket kunne være forstyrrende for nogle.
Tag et kig her:
Med tiden vil Microsoft muligvis løse dette problem, og med de nye AI-teknologier, der dukker op, kan den Redmond-baserede teknologigigant forvandle Azure-avataren til et industri-to-go-værktøj. Hvorfor? Fordi virksomheder allerede elsker værktøjet.
Vi bruger Azure AI Services til vores AI Banking-avatar på grund af den unikke kombination af førende AI- og visualiseringstjenester på én platform. Ved at bruge forskellige Azure AI Speech-tekst-til-tale-avatarer vil vi være i stand til at generere en kundeoplevelse på næste niveau og virkelig forenkle bank- og bankinteraktioner.
Gerald Ertl, administrerende direktør, Commerzbank AG
Microsoft har dog ikke taget hensyn til kundernes interaktioner med disse avatarer. Selvom de kunne være en meget billigere mulighed for virksomheder (og også hurtigere, bør en marketingmedarbejder være i stand til at skabe AI-genereret tutorials uden at ty til eksterne kilder), får manglen på meningsfulde fysiske udtryk disse avatarer til at se ud robotter.
AI kan ikke ignoreres, især hvis vi taler om værktøjer som Copilot on Windows 11 eller Microsoft 365, men når den gerne vil ligne mennesker, kan den blive ret uhyggelig.
Microsoft vil forfine disse avatarer, der er ingen tvivl om det, men indtil videre er der en følelse ned af ryggen, hver gang jeg ser på en af dem, kraftigt grinende eller slet ikke har noget udtryk.
Hvad synes du om disse avatarer?