Kosmos-2 bi mogao biti revolucionaran za Embodiment AI.
- Novo istraživanje koje je financirao Microsoft bavi se fizikalnošću umjetne inteligencije.
- Jezični model, Kosmos-2, osposobljen je za percepciju prostornih koncepata.
- Također dolazi s vlastitim znanjem o prostoru.
Microsoft je u posljednje vrijeme uložio mnogo sredstava u financiranje istraživanja umjetne inteligencije. Orca 13B je open source za javnost nakon što ga je izgradio tim istraživača koji je okupio i financirao Microsoft.
LongMem je Microsoftova nada za neograničenu duljinu konteksta u AI modelima. Također je proizvod istraživanja koje je financirao tehnološki div sa sjedištem u Redmondu.
Phi-1, novi jezični model za kodiranje, sposoban je sam učiti i razvijati znanje. Microsoft je financirao istraživanje za to.
I čini se da je Embodiment AI sljedeća potraga u razvoju umjetne inteligencije. Ali Microsoft bi mogao imati odgovor još jednim istraživanjem umjetne inteligencije. Ovaj put se radi o Kosmos-2, novi AI model koji postavlja temelje za Embodiment AI.
Microsoftov Kosmos-2 je prototip Embodiment AI
Možda je ovo prvi put da čujete za Embodiment AI. Pa, ime je samo po sebi prilično sugestivno. Dakle, što je Embodiment AI, mogli biste se zapitati?
Embodiment AI je polje umjetne inteligencije koje se fokusira na razvoj inteligentnih agenata koji imaju fizičko tijelo i mogu komunicirati sa svijetom na smislen način.
Koncept se temelji na ideji da fizičko tijelo igra značajnu ulogu u tome kako agent uči i donosi odluke.
Drugim riječima, kad bi umjetna inteligencija imala tijelo i kretala se, tada bi mogla učiti iz toga i odgovarati i oblikovati odgovore, kao i djelovati u skladu s tim. A ako mislite da ulazimo u područje znanstvene fantastike, držite se. AI je uvijek trebao postati fizički.
Prema istraživanju, Kosmos-2 je jezični model koji omogućuje nove mogućnosti percepcije opisa objekata (npr. graničnih okvira) i uzemljenja teksta u vizualni svijet. Predstavljeni istraživači odnose se na izraze kao poveznice u Markdownu, tj. "tekstualni raspon", gdje su opisi objekata nizovi tokena lokacije.
Zajedno s multimodalnim korpusima, konstruirali su podatke velikih razmjera utemeljenih parova slika-tekst (nazvanih GrIT) za obuku modela. Uz integraciju postojećih mogućnosti MLLM-a u Kosmos-2, model također integrira mogućnost uzemljenja u aplikacije.
To znači da je jezik napravio korak naprijed u percepciji prostora i osmislio vlastitu percepciju, djelovanje i modeliranje svijeta. Istraživači misle da je Kosmos-2 temelj za fizičku umjetnu inteligenciju. Možete pročitati istraživanje ovdje.
Što mislite o Microsoft Kosmosu 2? Bi li bilo dobro da AI ima fizički oblik ili ne? Javite nam u odjeljku za komentare ispod.