Azure tekst-til-tale-avatar kan forstyrre brukere med sine uhyggelige dalegenskaper

Microsoft vil helt sikkert avgrense teknologien er på tide å gjøre den mer menneskelig.

asurblå tekst til tale-avatar

Microsoft annonserte utgivelsen av Azure tekst-til-tale-avataren på Microsoft Ignite konferanse som finner sted i Seattle fra 14. til 17. november 2023. Azure-avataren er nå i offentlig forhåndsvisning, og Azure-brukere overalt kan bygge avataren sin bare med tekstinndata.

Vi er glade for å kunngjøre den offentlige forhåndsvisningen av Azure AI-tale tekst til tale-avatar, en ny funksjon som gjør det mulig for brukere å lage snakkende avatar-videoer med tekstinndata, og å bygge sanntids interaktive roboter som er trent ved hjelp av menneskelige bilder.

Microsoft

Den Redmond-baserte teknologigiganten tror Azure tekst-til-tale-avataren kan være en passende løsning å bekjempe tradisjonell videoinnholdsskaping, og små selskaper, som for eksempel startups, kan ha stor nytte av en slik verktøy.

Tradisjonell oppretting av videoinnhold krever mye tid og budsjett, inkludert å sette opp videoopptaksmiljø, filme videoer, redigere osv. Med tekst til tale-avatar kan brukere lage video mer effektivt. Brukere kan bruke avataren til å bygge opplæringsvideoer, produktintroduksjoner, kundeanbefalinger osv., ganske enkelt med tekstinndata.

Microsoft

Tekst-til-tale-avataren kan brukes til ulike applikasjoner:

  • En chatbot for et reisenettsted
  • Virtuelt salg i en direktereklame
  • AI-lærer som underviser på nett og kan svare på spørsmål
  • En virtuell HR for å svare på ansattes spørsmål

Selv om verktøyet vil være ganske nyttig for mange selskaper, kan det også generere videoer som på en eller annen måte mangler hele spekteret av menneskelige uttrykk. Her er grunnen:

Azure tekst-til-tale-avataren kan være nyttig, men den føles ikke ekte

Det er viktig å vite at Microsoft tilbyr to måter å generere en avatar på:

  • Forhåndsbygde tekst-til-tale-avatarer, med Microsoft som gir en liste over alternativer brukere kan velge mellom; disse avatarene vil kunne snakke forskjellige språk og ha forskjellige stemmer basert på innspill mottatt fra brukere.
  • Tilpassede tekst-til-tale-avatarer gjør det mulig for brukere å bygge sine tilpassede avatarer ved hjelp av virkelige bilder og videoer. Systemet vil ta disse ressursene og vil automatisk komme opp med en avatar som samsvarer med disse egenskapene. En viktig funksjon er at systemet vil få en avatar til å ligne brukeren hvis brukeren gir sin stemme og utseende.

Likevel mangler avatarene visse uttrykk, noe som gjør at de ser ganske robotiske ut.

La oss ta de 2 videoeksemplene som Microsoft la ut på blogginnlegget deres om produktene. Begge genereres ved hjelp av Azure tekst-til-tale-avataren. Den første, som du kan se nedenfor, har en avatar som viser hvordan brukere kan generere videoinnhold ved hjelp av Azure-avatarer.

Fra YouTube-miniatyrbildet kan du ikke se at modellen som presenteres i videoen faktisk er en avatar, men så snart du spiller av videoen, blir det klart at den er helt AI-generert. Synkroniseringen mellom avatarens ansiktsuttrykk og stemmen deres er noe merkelig.

Azure tekst-til-tale-avatar-teknologien gjør det mulig å bygge interaktive avatarer, det andre eksemplet som viser følelsen av uhyggelig dal (noe som fungerer som en menneskelig person, men det er ikke menneskelig).

Som Microsoft sier, bruker de interaktive avatarene Azure OpenAI Service GPT-3.5-modellen for å svare på kundeforespørsler, inkludert verbale dialoger med kunder på forskjellige språk. Dette alene gjør det utrolig nyttig, men igjen, interaksjonen ser kunstig ut og uten menneskelig interaksjon, noe som kan være urovekkende for noen.

Ta en titt her:

Med tiden kan Microsoft løse dette problemet, og med de nye AI-teknologiene som dukker opp, kan den Redmond-baserte teknologigiganten forvandle Azure-avataren til et industrielt verktøy. Hvorfor? Fordi bedrifter allerede elsker verktøyet.

Vi bruker Azure AI Services for vår AI Banking-avatar på grunn av den unike kombinasjonen av ledende AI- og visualiseringstjenester i én plattform. Ved å bruke forskjellige Azure AI Speech-tekst-til-tale-avatarer vil vi kunne generere en kundeopplevelse på neste nivå og virkelig forenkle bank- og bankinteraksjoner.

Gerald Ertl, administrerende direktør, Commerzbank AG

Microsoft har imidlertid ikke tatt hensyn til kundenes interaksjoner med disse avatarene. Selv om de kan være et mye billigere alternativ for selskaper (og raskere også, bør en markedsfører være i stand til å lage AI-generert veiledninger uten å ty til eksterne kilder), mangelen på noen meningsfulle fysiske uttrykk gjør at disse avatarene ser ut som roboter.

AI kan ikke ignoreres, spesielt hvis vi snakker om verktøy som Copilot på Windows 11 eller Microsoft 365, men når den vil ligne mennesker, kan den bli ganske uhyggelig.

Microsoft vil foredle disse avatarene, det er ingen tvil om det, men foreløpig er det en følelse nedover ryggraden min hver gang jeg ser på en av dem, flirende kraftig eller uten uttrykk i det hele tatt.

Hva synes du om disse avatarene?

Skylake-PCer som kjører Windows 7 og Windows 8.1, støttes av Microsoft frem til 2018

Skylake-PCer som kjører Windows 7 og Windows 8.1, støttes av Microsoft frem til 2018MicrosoftSkylake

I begynnelsen av dette året bekreftet Microsoft at de bare støtter utvalgte Skylake-PC-er som kjører Windows 7 eller 8, med en liste over 100 modeller av PC-er med Intels sjette generasjons prosess...

Les mer
Microsoft kan avsløre nye Windows Hello, Ink, Cortana og HoloLens-funksjoner på COMPUTEX 2016

Microsoft kan avsløre nye Windows Hello, Ink, Cortana og HoloLens-funksjoner på COMPUTEX 2016MicrosoftComputex 2016

Neste uke vil over 100.000 teknologibransjeselskaper fra over 29 land samles på COMPUTEX 2016 i Taipei for å diskutere de siste nyhetene, trendene og prosjektene i bransjen. Ingen andre enn Microso...

Les mer
Bør Microsoft anskaffe Canonical for sine åpen kildekode-ambisjoner?

Bør Microsoft anskaffe Canonical for sine åpen kildekode-ambisjoner?MicrosoftUbuntu

Som sent har Microsoft blitt vennligere med open source-fellesskapet, et flott tegn for hva du kan forvente i fremtiden. Mange beslutninger og tiltak er tatt for å sementere selskapets støtte til å...

Les mer