Το avatar μετατροπής κειμένου σε ομιλία Azure μπορεί να ενοχλήσει τους χρήστες με τα παράξενα χαρακτηριστικά του στην κοιλάδα

Η Microsoft σίγουρα θα βελτιώσει την τεχνολογία είναι καιρός να την κάνει πιο ανθρώπινη.

γαλάζιο avatar από κείμενο σε ομιλία

Η Microsoft ανακοίνωσε την κυκλοφορία του avatar μετατροπής κειμένου σε ομιλία Azure στο Microsoft Ignite συνέδριο που θα πραγματοποιηθεί στο Σιάτλ από τις 14 έως τις 17 Νοεμβρίου 2023. Το avatar Azure είναι τώρα σε δημόσια προεπισκόπηση και οι χρήστες του Azure παντού μπορούν να δημιουργήσουν το avatar τους μόνο με εισαγωγές κειμένου.

Είμαστε στην ευχάριστη θέση να ανακοινώσουμε τη δημόσια προεπισκόπηση του Ομιλία Azure AI avatar κειμένου σε ομιλία, μια νέα δυνατότητα που δίνει τη δυνατότητα στους χρήστες να δημιουργούν ομιλούντα βίντεο avatar με εισαγωγή κειμένου και να δημιουργούν διαδραστικά bots σε πραγματικό χρόνο που εκπαιδεύονται χρησιμοποιώντας ανθρώπινες εικόνες.

Microsoft

Ο τεχνολογικός γίγαντας που εδρεύει στο Ρέντμοντ πιστεύει ότι το avatar μετατροπής κειμένου σε ομιλία Azure μπορεί να είναι μια κατάλληλη λύση για την καταπολέμηση Η παραδοσιακή δημιουργία περιεχομένου βίντεο και οι μικρές εταιρείες, όπως οι νεοφυείς επιχειρήσεις, θα μπορούσαν να ωφεληθούν σε μεγάλο βαθμό από μια τέτοια εργαλείο.

Η δημιουργία παραδοσιακού περιεχομένου βίντεο απαιτεί πολύ χρόνο και προϋπολογισμό, συμπεριλαμβανομένης της ρύθμισης περιβάλλοντος λήψης βίντεο, της βιντεοσκόπησης, της επεξεργασίας κ.λπ. Με το avatar κειμένου σε ομιλία, οι χρήστες μπορούν να δημιουργήσουν πιο αποτελεσματικά βίντεο. Οι χρήστες μπορούν να χρησιμοποιήσουν το avatar για να δημιουργήσουν εκπαιδευτικά βίντεο, εισαγωγές προϊόντων, μαρτυρίες πελατών κ.λπ., απλά με εισαγωγή κειμένου.

Microsoft

Το avatar μετατροπής κειμένου σε ομιλία μπορεί να χρησιμοποιηθεί για διάφορες εφαρμογές:

  • Ένα chatbot για έναν ταξιδιωτικό ιστότοπο
  • Εικονικές πωλήσεις σε ζωντανή διαφήμιση
  • Δάσκαλος AI που διδάσκει διαδικτυακά και μπορεί να απαντήσει σε ερωτήσεις
  • Ένα εικονικό HR για να απαντήσει στις ερωτήσεις των εργαζομένων

Αν και το εργαλείο θα είναι αρκετά χρήσιμο σε πολλές εταιρείες, μπορεί επίσης να δημιουργήσει βίντεο που κατά κάποιο τρόπο δεν έχουν το πλήρες φάσμα των ανθρώπινων εκφράσεων. Να γιατί:

Το avatar μετατροπής κειμένου σε ομιλία Azure θα μπορούσε να είναι χρήσιμο, αλλά δεν φαίνεται αληθινό

Είναι σημαντικό να γνωρίζετε ότι η Microsoft προσφέρει 2 τρόπους για να δημιουργήσετε ένα avatar:

  • Προκατασκευασμένα avatar μετατροπής κειμένου σε ομιλία, με τη Microsoft να παρέχει μια λίστα επιλογών από τις οποίες μπορούν να επιλέξουν οι χρήστες. Αυτά τα άβαταρ θα μπορούν να μιλούν διαφορετικές γλώσσες και να έχουν διαφορετικές φωνές με βάση τα δεδομένα που λαμβάνουν οι χρήστες.
  • Τα προσαρμοσμένα avatar μετατροπής κειμένου σε ομιλία επιτρέπουν στους χρήστες να δημιουργήσουν τα προσαρμοσμένα avatar τους χρησιμοποιώντας εικόνες και βίντεο πραγματικής ζωής. Το σύστημα θα λάβει αυτούς τους πόρους και θα βρει αυτόματα ένα avatar που ταιριάζει με αυτά τα χαρακτηριστικά. Ένα σημαντικό χαρακτηριστικό είναι ότι το σύστημα θα κάνει ένα avatar να μοιάζει με τον χρήστη εάν ο χρήστης παρέχει τη φωνή και την εμφάνισή του.

Ακόμα κι έτσι, τα avatar στερούνται ορισμένες εκφράσεις, γεγονός που τα κάνει να φαίνονται αρκετά ρομποτικά.

Ας πάρουμε τα 2 παραδείγματα βίντεο που δημοσίευσε η Microsoft στην ανάρτηση ιστολογίου της σχετικά με τα προϊόντα. Και τα δύο δημιουργούνται χρησιμοποιώντας το avatar μετατροπής κειμένου σε ομιλία Azure. Το πρώτο, όπως μπορείτε να δείτε παρακάτω, διαθέτει ένα avatar που δείχνει πώς οι χρήστες μπορούν να δημιουργήσουν περιεχόμενο βίντεο χρησιμοποιώντας avatars Azure.

Από τη μικρογραφία του YouTube, δεν μπορείτε να πείτε ότι το μοντέλο που παρουσιάζεται στο βίντεο είναι στην πραγματικότητα ένα avatar, αλλά μόλις παίξετε το βίντεο, γίνεται σαφές ότι έχει δημιουργηθεί εξ ολοκλήρου από την τεχνητή νοημοσύνη. Ο συγχρονισμός μεταξύ των εκφράσεων του προσώπου του avatar και της φωνής τους είναι κάπως περίεργος.

Η τεχνολογία avatar text-to-speech Azure επιτρέπει τη δημιουργία διαδραστικών avatar, το δεύτερο παράδειγμα που δείχνει την αίσθηση της παράξενης κοιλάδας (κάτι που λειτουργεί σαν άνθρωπος, αλλά δεν είναι ο άνθρωπος).

Όπως λέει η Microsoft, τα διαδραστικά avatars χρησιμοποιούν το μοντέλο Azure OpenAI Service GPT-3.5 για να απαντούν σε ερωτήματα πελατών, συμπεριλαμβανομένων λεκτικών διαλόγων με πελάτες σε διαφορετικές γλώσσες. Αυτό από μόνο του το καθιστά απίστευτα χρήσιμο, αλλά και πάλι, η αλληλεπίδραση φαίνεται τεχνητή και στερείται οποιασδήποτε ανθρώπινης αλληλεπίδρασης, κάτι που θα μπορούσε να είναι ενοχλητικό για ορισμένους.

Ρίξτε μια ματιά εδώ:

Με τον καιρό, η Microsoft μπορεί να λύσει αυτό το ζήτημα και με την εμφάνιση των νέων τεχνολογιών τεχνητής νοημοσύνης, ο τεχνολογικός γίγαντας που βασίζεται στο Ρέντμοντ θα μπορούσε να μετατρέψει το avatar του Azure σε ένα εργαλείο που θα κυκλοφορήσει στη βιομηχανία. Γιατί; Επειδή οι εταιρείες αγαπούν ήδη το εργαλείο.

Χρησιμοποιούμε τις Υπηρεσίες Azure AI για το AI Banking Avatar μας λόγω του μοναδικού συνδυασμού προηγμένων υπηρεσιών AI και Visualization σε μία πλατφόρμα. Χρησιμοποιώντας διαφορετικό avatar ομιλίας Azure AI, κείμενο σε ομιλία, θα είμαστε σε θέση να δημιουργήσουμε μια εμπειρία πελάτη επόμενου επιπέδου και να απλοποιήσουμε πραγματικά τις τραπεζικές και τραπεζικές αλληλεπιδράσεις.

Gerald Ertl, Διευθύνων Σύμβουλος, Commerzbank AG

Ωστόσο, η Microsoft δεν έχει λάβει υπόψη τις αλληλεπιδράσεις των πελατών με αυτά τα avatar. Ενώ θα μπορούσαν να είναι μια πολύ φθηνότερη επιλογή για τις εταιρείες (και πιο γρήγορα, ένας έμπορος θα πρέπει να μπορεί να δημιουργήσει τεχνητή νοημοσύνη tutorials χωρίς να καταφεύγουμε σε εξωτερικές πηγές), η έλλειψη ουσιαστικών φυσικών εκφράσεων κάνει αυτά τα avatar να μοιάζουν ρομπότ.

Το AI δεν μπορεί να αγνοηθεί, ειδικά αν μιλάμε για εργαλεία όπως το Copilot on Windows 11 ή Microsoft 365, αλλά όταν θέλει να μοιάζει με ανθρώπους, θα μπορούσε να γίνει αρκετά παράξενο.

Η Microsoft θα βελτιώσει αυτά τα άβαταρ, δεν υπάρχει καμία αμφιβολία γι' αυτό, αλλά προς το παρόν, κάθε φορά που κοιτάζω ένα από αυτά, έχω μια αίσθηση κάτω από τη ράχη μου, χαμογελώντας με δύναμη ή χωρίς καμία έκφραση.

Τι γνώμη έχετε για αυτά τα άβαταρ;

Γνωρίστε στο Microsoft Teams: Όλα όσα πρέπει να γνωρίζετε για αυτό

Γνωρίστε στο Microsoft Teams: Όλα όσα πρέπει να γνωρίζετε για αυτόMicrosoftομάδες της Microsoft

Το Meet είναι πλέον διαθέσιμο στο Microsoft Teams.Το Meet είναι πλέον διαθέσιμο στις Ομάδες της Microsoft και ο τεχνολογικός γίγαντας που εδρεύει στο Ρέντμοντ υπόσχεται ότι θα βελτιώσει σημαντικά τ...

Διαβάστε περισσότερα
Η Αναζήτηση της Microsoft επιτρέπει στους χρήστες να βρίσκουν αρχεία εργασίας στη γραμμή αναζήτησης των Windows

Η Αναζήτηση της Microsoft επιτρέπει στους χρήστες να βρίσκουν αρχεία εργασίας στη γραμμή αναζήτησης των WindowsMicrosoftαναζήτηση της Microsoftαναζήτηση της Microsoft

Το εργαλείο αναζήτησης σημείωσε πολλές βελτιώσεις.Η Microsoft ανακοίνωσε την κυκλοφορία νέων λειτουργιών και βελτιώσεων στη μηχανή αναζήτησής της, Microsoft Search, σύμφωνα με την εταιρεία τελευταί...

Διαβάστε περισσότερα
Το Outlook αποκτά 2 νέες δυνατότητες που θα αυξήσουν σημαντικά τη δημοτικότητά του

Το Outlook αποκτά 2 νέες δυνατότητες που θα αυξήσουν σημαντικά τη δημοτικότητά τουMicrosoftΑποψη

Τα χαρακτηριστικά θα κυκλοφορήσουν τον Δεκέμβριο και τον Ιανουάριο. Το Outlook θα αποκτήσει 2 νέες δυνατότητες τους επόμενους μήνες που θα μπορούσαν ενδεχομένως να αυξήσουν τη δημοτικότητά του μετα...

Διαβάστε περισσότερα