Το Kosmos-2 θα μπορούσε να είναι επαναστατικό για το Embodiment AI.
- Νέα έρευνα που χρηματοδοτείται από τη Microsoft εμβαθύνει στη φυσική κατάσταση της τεχνητής νοημοσύνης.
- Το γλωσσικό μοντέλο, Kosmos-2, εκπαιδεύτηκε να αντιλαμβάνεται χωρικές έννοιες.
- Έρχεται επίσης με τη δική του γνώση του χώρου.
Η Microsoft έχει επενδύσει πολύ προϋπολογισμό για τη χρηματοδότηση της έρευνας για την τεχνητή νοημοσύνη τον τελευταίο καιρό. Όρκα 13Β είναι ανοιχτού κώδικα για το κοινό αφού το κατασκεύασε μια ομάδα ερευνητών που συγκέντρωσε και χρηματοδοτήθηκε από τη Microsoft.
LongMem είναι η ελπίδα της Microsoft για απεριόριστο μήκος περιβάλλοντος σε μοντέλα AI. Και είναι επίσης προϊόν έρευνας που χρηματοδοτείται από τον τεχνολογικό γίγαντα που εδρεύει στο Ρέντμοντ.
Phi-1, ένα νέο γλωσσικό μοντέλο κωδικοποίησης, είναι ικανό να μαθαίνει και να αναπτύσσει τη γνώση από μόνο του. Η Microsoft χρηματοδότησε την έρευνα για αυτό.
Και φαίνεται ότι το Embodiment AI είναι η επόμενη αναζήτηση στην ανάπτυξη AI. Αλλά η Microsoft μπορεί απλώς να έχει την απάντηση με μια άλλη έρευνα για την τεχνητή νοημοσύνη. Αυτή τη φορά πρόκειται για
Κόσμος-2, ένα νέο μοντέλο AI που θέτει τα θεμέλια για την Ενσωμάτωση AI.Το Kosmos-2 της Microsoft είναι το πρωτότυπο Embodiment AI
Ίσως αυτή είναι η πρώτη φορά που ακούτε για το Embodiment AI. Λοιπόν, το όνομα είναι αρκετά υποδηλωτικό από μόνο του. Τι είναι λοιπόν το Embodiment AI, θα ρωτήσετε;
Το Embodiment AI είναι ένα πεδίο τεχνητής νοημοσύνης που εστιάζει στην ανάπτυξη ευφυών παραγόντων που έχουν φυσικό σώμα και μπορούν να αλληλεπιδράσουν με τον κόσμο με ουσιαστικό τρόπο.
Η ιδέα βασίζεται στην ιδέα ότι το φυσικό σώμα παίζει σημαντικό ρόλο στο πώς ένας πράκτορας μαθαίνει και παίρνει αποφάσεις.
Με άλλα λόγια, εάν η τεχνητή νοημοσύνη είχε σώμα και κινούνταν, τότε θα μπορούσε να μάθει από αυτό και να απαντήσει και να σχηματίσει απαντήσεις, καθώς και να αλληλεπιδράσει ανάλογα. Και αν νομίζετε ότι μπαίνουμε σε περιοχή επιστημονικής φαντασίας, κρατήστε τη θέση σας. Η τεχνητή νοημοσύνη έπρεπε πάντα να γίνει φυσική.
Σύμφωνα με την έρευνα, το Kosmos-2 είναι ένα γλωσσικό μοντέλο που επιτρέπει νέες δυνατότητες αντίληψης περιγραφών αντικειμένων (π.χ. οριοθέτηση πλαισίων) και γείωσης κειμένου στον οπτικό κόσμο. Οι ερευνητές αντιπροσώπευαν τις εκφράσεις ως συνδέσμους στο Markdown, δηλ., «έκταση κειμένου», όπου οι περιγραφές αντικειμένων είναι ακολουθίες διακριτικών τοποθεσίας.
Μαζί με πολυτροπικά σώματα, κατασκεύασαν δεδομένα μεγάλης κλίμακας γειωμένων ζευγών εικόνας-κειμένου (που ονομάζονται GrIT) για να εκπαιδεύσουν το μοντέλο. Εκτός από την ενσωμάτωση των υπαρχουσών δυνατοτήτων των MLLM στο Kosmos-2, το μοντέλο ενσωματώνει επίσης τη δυνατότητα γείωσης σε εφαρμογές.
Αυτό σημαίνει ότι η γλώσσα έχει κάνει βήματα προς τα εμπρός για να αντιληφθεί τον χώρο και να καταλήξει στη δική της αντίληψη, δράση και μοντελοποίηση του κόσμου. Οι ερευνητές πιστεύουν ότι με αυτόν τον τρόπο το Kosmos-2 είναι το θεμέλιο για ένα φυσικό AI. Μπορείτε να διαβάσετε την έρευνα εδώ.
Τι πιστεύετε για το Microsoft Kosmos 2; Θα ήταν καλό αν η τεχνητή νοημοσύνη έχει φυσική μορφή ή όχι; Ενημερώστε μας στην παρακάτω ενότητα σχολίων.