Kosmos-2 ar putea fi revoluționar pentru Embodiment AI.
- O nouă cercetare finanțată de Microsoft analizează fizicitatea AI.
- Modelul de limbaj, Kosmos-2, a fost antrenat pentru a percepe concepte spațiale.
- De asemenea, vine cu propriile cunoștințe despre spațiu.
Microsoft a alocat mult buget pentru finanțarea cercetării AI în ultima vreme. Orca 13B este open source pentru public după ce o echipă de cercetători asamblată și finanțată de Microsoft l-a construit.
LongMem este speranța Microsoft pentru o lungime nelimitată a contextului în modelele AI. Și este, de asemenea, un produs al cercetării finanțate de gigantul tehnologic din Redmond.
Phi-1, un nou model de limbaj pentru codare, este capabil să învețe și să dezvolte cunoștințe pe cont propriu. Microsoft a finanțat cercetarea pentru aceasta.
Și se pare că Embodiment AI este următoarea căutare în dezvoltarea AI. Dar Microsoft ar putea avea răspunsul doar cu o altă cercetare despre AI. De data aceasta este vorba Kosmos-2, un nou model AI care pune bazele pentru AI Embodiment.
Kosmos-2 de la Microsoft este prototipul Embodiment AI
Poate că aceasta este prima dată când auziți despre Embodiment AI. Ei bine, numele este destul de sugestiv în sine. Deci, ce este Embodiment AI, te-ai putea întreba?
Embodiment AI este un domeniu al inteligenței artificiale care se concentrează pe dezvoltarea agenților inteligenți care au un corp fizic și pot interacționa cu lumea într-un mod semnificativ.
Conceptul se bazează pe ideea că corpul fizic joacă un rol semnificativ în modul în care un agent învață și ia decizii.
Cu alte cuvinte, dacă AI ar avea un corp și s-ar mișca, atunci ar putea învăța din asta și să răspundă și să formeze răspunsuri, precum și să interacționeze în consecință. Și dacă crezi că intrăm pe teritoriul science fiction-ului, ține-ți locul. AI a trebuit întotdeauna să devină fizică.
Potrivit cercetării, Kosmos-2 este un model de limbaj care permite noi capacități de percepere a descrierilor obiectelor (de exemplu, casete de delimitare) și de a lega textul în lumea vizuală. Cercetătorii reprezentați se referă la expresii ca legături în Markdown, adică „interval de text”, unde descrierile obiectelor sunt secvențe de indicatoare de locație.
Împreună cu corpuri multimodale, au construit date la scară mare de perechi imagine-text bazate pe pământ (numite GrIT) pentru a antrena modelul. Pe lângă integrarea capabilităților existente ale MLLM-urilor în Kosmos-2, modelul integrează și capacitatea de împământare în aplicații.
Aceasta înseamnă că limbajul a făcut pași înainte pentru a percepe spațiul și a veni cu propria sa percepție, acțiune și modelare a lumii. Cercetătorii cred în acest fel Kosmos-2 este fundația unei IA fizice. Puteți citi cercetarea Aici.
Ce părere aveți despre Microsoft Kosmos 2? Ar fi bine dacă AI are o formă fizică sau nu? Anunțați-ne în secțiunea de comentarii de mai jos.