L'avatar de synthèse vocale Azure pourrait déranger les utilisateurs avec ses étranges caractéristiques de vallée

Microsoft va sûrement affiner la technologie, il est temps de la rendre plus humaine.

avatar de synthèse vocale Azure

Microsoft a annoncé la sortie de l'avatar de synthèse vocale Azure au Microsoft Ignite conférence qui aura lieu à Seattle du 14 au 17 novembre 2023. L'avatar Azure est désormais en préversion publique et les utilisateurs Azure du monde entier peuvent créer leur avatar uniquement avec des saisies de texte.

Nous sommes ravis d'annoncer la version préliminaire publique de Discours Azure IA avatar de synthèse vocale, une nouvelle fonctionnalité qui permet aux utilisateurs de créer des vidéos d'avatar parlant avec saisie de texte et de créer des robots interactifs en temps réel entraînés à l'aide d'images humaines.

Microsoft

Le géant de la technologie basé à Redmond pense que l'avatar de synthèse vocale Azure pourrait être une solution appropriée pour lutter contre la création de contenu vidéo traditionnel, et les petites entreprises, telles que les startups, pourraient grandement bénéficier d'un tel outil.

La création de contenu vidéo traditionnel nécessite beaucoup de temps et de budget, notamment la configuration de l'environnement de tournage vidéo, le tournage de vidéos, le montage, etc. Avec l'avatar de synthèse vocale, les utilisateurs peuvent créer plus efficacement des vidéos. Les utilisateurs peuvent utiliser l'avatar pour créer des vidéos de formation, des présentations de produits, des témoignages de clients, etc., simplement avec la saisie de texte.

Microsoft

L'avatar de synthèse vocale peut être utilisé pour diverses applications :

  • Un chatbot pour un site de voyage
  • Ventes virtuelles dans une publicité en direct
  • Professeur d'IA qui enseigne en ligne et peut répondre aux questions
  • Une RH virtuelle pour répondre aux questions des collaborateurs

Bien que l’outil soit très utile à de nombreuses entreprises, il peut également générer des vidéos qui, d’une manière ou d’une autre, ne disposent pas de tout le spectre des expressions humaines. Voici pourquoi:

L’avatar de synthèse vocale Azure pourrait être utile, mais il ne semble pas réel

Il est important de savoir que Microsoft propose 2 manières de générer un avatar:

  • Avatars de synthèse vocale prédéfinis, Microsoft fournissant une liste d'options parmi lesquelles les utilisateurs peuvent choisir; ces avatars pourront parler différentes langues et avoir des voix différentes en fonction des commentaires reçus des utilisateurs.
  • Les avatars de synthèse vocale personnalisés permettent aux utilisateurs de créer leurs avatars personnalisés en utilisant des images et des vidéos réelles. Le système utilisera ces ressources et proposera automatiquement un avatar correspondant à ces caractéristiques. Une caractéristique importante est que le système fera ressembler un avatar à l'utilisateur si celui-ci fournit sa voix et son apparence.

Malgré cela, les avatars manquent de certaines expressions, ce qui leur donne un aspect assez robotique.

Prenons les 2 exemples vidéo publiés par Microsoft sur leur blog sur les produits. Les deux sont générés à l’aide de l’avatar de synthèse vocale Azure. Le premier, comme vous pouvez le voir ci-dessous, présente un avatar montrant comment les utilisateurs peuvent générer du contenu vidéo à l'aide d'avatars Azure.

À partir de la vignette YouTube, vous ne pouvez pas dire que le modèle présenté dans la vidéo est en réalité un avatar, mais dès que vous regardez la vidéo, il devient clair qu'elle est entièrement générée par l'IA. La synchronisation entre les expressions faciales de l’avatar et sa voix est quelque peu étrange.

La technologie d'avatar de synthèse vocale Azure permet la création d'avatars interactifs, le deuxième exemple qui met en valeur le sentiment d'une étrange vallée (quelque chose qui agit comme une personne humaine, mais ce n'est pas le cas). humain).

Comme le dit Microsoft, les avatars interactifs utilisent le modèle Azure OpenAI Service GPT-3.5 pour répondre aux requêtes des clients, y compris les dialogues verbaux avec les clients dans différentes langues. Cela seul le rend incroyablement utile, mais encore une fois, l’interaction semble artificielle et dépourvue de toute interaction humaine, ce qui pourrait être dérangeant pour certains.

Jetez un oeil ici:

Avec le temps, Microsoft pourrait résoudre ce problème et, avec l'émergence de nouvelles technologies d'IA, le géant de la technologie basé à Redmond pourrait transformer l'avatar Azure en un outil incontournable pour l'industrie. Pourquoi? Parce que les entreprises adorent déjà cet outil.

Nous utilisons Azure AI Services pour notre AI Banking Avatar en raison de la combinaison unique de services d’IA et de visualisation de pointe sur une seule plateforme. En utilisant différents avatars de synthèse vocale Azure AI Speech, nous serons en mesure de générer une expérience client de niveau supérieur et de vraiment simplifier les interactions bancaires et bancaires.

Gerald Ertl, directeur général, Commerzbank AG

Cependant, Microsoft n’a pas pris en compte les interactions des clients avec ces avatars. Bien qu'ils puissent constituer une option beaucoup moins coûteuse pour les entreprises (et plus rapides également, un spécialiste du marketing devrait être en mesure de créer des tutoriels sans recourir à des sources externes), l'absence d'expressions physiques significatives fait ressembler ces avatars à des robots.

L'IA ne peut être ignorée, surtout si l'on parle d'outils tels que Copilot sur Windows 11 ou Microsoft 365, mais quand il veut ressembler à des humains, cela peut devenir assez étrange.

Microsoft va affiner ces avatars, cela ne fait aucun doute, mais pour l'instant, j'ai une sensation dans le dos à chaque fois que je regarde l'un d'entre eux, souriant avec force ou n'ayant aucune expression du tout.

Que pensez-vous de ces avatars ?

La télémétrie Windows 10 pourrait modifier la protection des données des utilisateurs avec une nouvelle mise à jour

La télémétrie Windows 10 pourrait modifier la protection des données des utilisateurs avec une nouvelle mise à jourMicrosoftTélémétrie Windows 10

La page des paramètres de télémétrie de Windows 10 vient de recevoir un nouveau libellé dans la version 18898 (20H1), par rapport à la version 18362 (19H1).Tero Alhonen a été le premier à remarquer...

Lire la suite
Microsoft: nous ne fournissons pas d'e-mails/messages à la NSA, le gouvernement refuse la divulgation des demandes de données

Microsoft: nous ne fournissons pas d'e-mails/messages à la NSA, le gouvernement refuse la divulgation des demandes de donnéesMicrosoft

Le récent scandale de la NSA est probablement l'un des sujets les plus discutés, avec de nouvelles découvertes apparaissant chaque jour. Microsoft joue également un rôle central à cet égard, après ...

Lire la suite
Skype était en panne dans le monde entier, Microsoft ne s'est pas empressé de résoudre le problème

Skype était en panne dans le monde entier, Microsoft ne s'est pas empressé de résoudre le problèmeMicrosoftSkype

Microsoft a récemment signalé que son service de communication Internet, Skype, a cessé de travailler pour de nombreuses personnes à travers le monde. Selon l'entreprise, la plupart des problèmes s...

Lire la suite