Microsoft noteikti uzlabos tehnoloģiju, ir laiks padarīt to cilvēciskāku.
Microsoft paziņoja par Azure teksta-runas iemiesojuma izlaišanu Microsoft Ignite konference, kas notiks Sietlā no 2023. gada 14. līdz 17. novembrim. Azure iemiesojums tagad ir pieejams publiskajā priekšskatījumā, un Azure lietotāji visur var izveidot savu iemiesojumu, tikai izmantojot teksta ievadi.
Ar prieku paziņojam par publikas priekšskatījuma izlaišanu Azure AI runa iemiesojums no teksta uz runu — jauna funkcija, kas lietotājiem ļauj izveidot runājošus iemiesojuma videoklipus ar teksta ievadi un izveidot reāllaika interaktīvus robotus, kas apmācīti, izmantojot cilvēku attēlus.
Microsoft
Redmondā bāzētais tehnoloģiju gigants uzskata, ka Azure teksta-runas iemiesojums varētu būt piemērots risinājums cīņai pret tradicionālā video satura izveide, un mazie uzņēmumi, piemēram, jaunuzņēmumi, varētu gūt lielu labumu no šāda rīks.
Tradicionālā video satura veidošana prasa daudz laika un budžeta, tostarp video uzņemšanas vides izveidošana, video filmēšana, montāža utt. Izmantojot teksta pārvēršanas runu iemiesojumu, lietotāji var efektīvāk izveidot video. Lietotāji var izmantot iemiesojumu, lai vienkārši ar teksta ievadi izveidotu mācību video, produktu iepazīstināšanu, klientu atsauksmes utt.
Microsoft
Teksta pārvēršanas runā iemiesojumu var izmantot dažādām lietojumprogrammām:
- Tērzēšanas robots ceļojumu vietnei
- Virtuālā pārdošana tiešraidē
- AI skolotājs, kurš māca tiešsaistē un var atbildēt uz jautājumiem
- Virtuāls HR, lai atbildētu uz darbinieku jautājumiem
Lai gan rīks būs diezgan noderīgs daudziem uzņēmumiem, tas var arī ģenerēt videoklipus, kuriem kaut kā trūkst visa cilvēka izpausmju spektra. Lūk, kāpēc:
Azure teksta pārvēršanas runā iemiesojums varētu būt noderīgs, taču tas nešķiet īsts
Ir svarīgi zināt, ka Microsoft piedāvā 2 veidus, kā izveidot iemiesojumu:
- Iepriekš izveidoti iemiesojumi teksta pārvēršanai runāMicrosoft nodrošina to opciju sarakstu, no kurām lietotāji var izvēlēties; šie iemiesojumi varēs runāt dažādās valodās, un tiem būs dažādas balsis, pamatojoties uz no lietotājiem saņemto ievadi.
- Pielāgoti iemiesojumi teksta pārvēršanai runā ļauj lietotājiem izveidot savus pielāgotos iemiesojumus izmantojot reālus attēlus un video. Sistēma izmantos šos resursus un automātiski izstrādās iemiesojumu, kas atbilst šīm īpašībām. Svarīga iezīme ir tāda, ka sistēma padarīs iemiesojumu līdzīgu lietotājam, ja lietotājs nodrošinās savu balsi un izskatu.
Tomēr iemiesojumiem trūkst noteiktu izteiksmju, kas liek tiem izskatīties diezgan robotiski.
Ņemsim 2 video piemērus, ko Microsoft ievietoja savā emuāra ziņā par produktiem. Abi tiek ģenerēti, izmantojot Azure teksta-runas iemiesojumu. Pirmajā, kā redzat tālāk, ir iemiesojums, kas parāda, kā lietotāji var ģenerēt video saturu, izmantojot Azure iemiesojumus.
No YouTube sīktēla nevar saprast, ka videoklipā parādītais modelis patiesībā ir iemiesojums, taču, tiklīdz atskaņojat videoklipu, kļūst skaidrs, ka tas ir pilnībā AI ģenerēts. Sinhronizācija starp iemiesojuma sejas izteiksmēm un viņu balsi ir nedaudz dīvaina.
Otrais piemērs ir Azure teksta-runas iemiesojuma tehnoloģija, kas ļauj izveidot interaktīvus iemiesojumus kas demonstrē neparastas ielejas sajūtu (kaut kas darbojas kā cilvēks, bet tā nav cilvēks).
Kā saka Microsoft, interaktīvie iemiesojumi izmanto Azure OpenAI Service GPT-3.5 modeli, lai atbildētu uz klientu jautājumiem, tostarp mutiskiem dialogiem ar klientiem dažādās valodās. Tas vien padara to neticami noderīgu, taču atkal mijiedarbība izskatās mākslīga un tai nav nekādas cilvēku mijiedarbības, kas dažiem varētu būt satraucoši.
Ieskaties šeit:
Ar laiku Microsoft varētu atrisināt šo problēmu, un līdz ar jauno AI tehnoloģiju parādīšanos Redmondā bāzētais tehnoloģiju gigants varētu pārveidot Azure iemiesojumu par nozarē izmantojamu rīku. Kāpēc? Jo uzņēmumi jau mīl šo rīku.
Mēs izmantojam Azure AI pakalpojumus savam AI banku iemiesojumam, jo vienā platformā ir unikāla vadošo AI un vizualizācijas pakalpojumu kombinācija. Izmantojot dažādus Azure AI runas teksta-runas iemiesojumu, mēs varēsim radīt nākamā līmeņa klientu pieredzi un patiešām vienkāršot banku un banku mijiedarbību.
Džeralds Ertls, Commerzbank AG rīkotājdirektors
Tomēr Microsoft nav ņēmusi vērā klientu mijiedarbību ar šiem iemiesojumiem. Lai gan tie varētu būt daudz lētāks risinājums uzņēmumiem (un arī ātrāk, tirgotājam vajadzētu būt iespējai izveidot mākslīgā intelekta radītu pamācības, neizmantojot ārējos avotus), jēgpilnu fizisko izpausmju trūkums liek šiem iemiesojumiem izskatīties roboti.
AI nevar ignorēt, it īpaši, ja mēs runājam par tādiem rīkiem kā Copilot on Windows 11 vai Microsoft 365, bet, ja tas vēlas līdzināties cilvēkiem, tas var kļūt diezgan neparasts.
Microsoft pilnveidos šos iemiesojumus, par to nav šaubu, bet pagaidām man ir sajūta, ka katru reizi, kad es paskatos uz kādu no tiem, vardarbīgi smaidot vai bez izteiksmes.
Ko jūs domājat par šiem iemiesojumiem?