Microsoft Kosmos-2: Kako AI može komunicirati sa svijetom

Kosmos-2 bi mogao biti revolucionaran za Embodiment AI.

  • Novo istraživanje koje je financirao Microsoft bavi se fizikalnošću umjetne inteligencije.
  • Jezični model, Kosmos-2, osposobljen je za percepciju prostornih koncepata.
  • Također dolazi s vlastitim znanjem o prostoru.
microsoft kosmos 2

Microsoft je u posljednje vrijeme uložio mnogo sredstava u financiranje istraživanja umjetne inteligencije. Orca 13B je open source za javnost nakon što ga je izgradio tim istraživača koji je okupio i financirao Microsoft.

LongMem je Microsoftova nada za neograničenu duljinu konteksta u AI modelima. Također je proizvod istraživanja koje je financirao tehnološki div sa sjedištem u Redmondu.

Phi-1, novi jezični model za kodiranje, sposoban je sam učiti i razvijati znanje. Microsoft je financirao istraživanje za to.

I čini se da je Embodiment AI sljedeća potraga u razvoju umjetne inteligencije. Ali Microsoft bi mogao imati odgovor još jednim istraživanjem umjetne inteligencije. Ovaj put se radi o Kosmos-2, novi AI model koji postavlja temelje za Embodiment AI.

Microsoftov Kosmos-2 je prototip Embodiment AI

Možda je ovo prvi put da čujete za Embodiment AI. Pa, ime je samo po sebi prilično sugestivno. Dakle, što je Embodiment AI, mogli biste se zapitati?

Embodiment AI je polje umjetne inteligencije koje se fokusira na razvoj inteligentnih agenata koji imaju fizičko tijelo i mogu komunicirati sa svijetom na smislen način.

Koncept se temelji na ideji da fizičko tijelo igra značajnu ulogu u tome kako agent uči i donosi odluke.microsoft kosmos 2

Drugim riječima, kad bi umjetna inteligencija imala tijelo i kretala se, tada bi mogla učiti iz toga i odgovarati i oblikovati odgovore, kao i djelovati u skladu s tim. A ako mislite da ulazimo u područje znanstvene fantastike, držite se. AI je uvijek trebao postati fizički.

Prema istraživanju, Kosmos-2 je jezični model koji omogućuje nove mogućnosti percepcije opisa objekata (npr. graničnih okvira) i uzemljenja teksta u vizualni svijet. Predstavljeni istraživači odnose se na izraze kao poveznice u Markdownu, tj. "tekstualni raspon", gdje su opisi objekata nizovi tokena lokacije.

Zajedno s multimodalnim korpusima, konstruirali su podatke velikih razmjera utemeljenih parova slika-tekst (nazvanih GrIT) za obuku modela. Uz integraciju postojećih mogućnosti MLLM-a u Kosmos-2, model također integrira mogućnost uzemljenja u aplikacije.

To znači da je jezik napravio korak naprijed u percepciji prostora i osmislio vlastitu percepciju, djelovanje i modeliranje svijeta. Istraživači misle da je Kosmos-2 temelj za fizičku umjetnu inteligenciju. Možete pročitati istraživanje ovdje.

Što mislite o Microsoft Kosmosu 2? Bi li bilo dobro da AI ima fizički oblik ili ne? Javite nam u odjeljku za komentare ispod.

Microsoft donosi 4K podršku za aplikaciju Filmovi i TV na sustavu Windows 10, Xbox One

Microsoft donosi 4K podršku za aplikaciju Filmovi i TV na sustavu Windows 10, Xbox OneMicrosoftAplikacija Za Filmove I TvWindows 10Xbox Jedan

Windows 10 i Xbox One korisnici će uskoro moći kupiti i reproducirati 4K Ultra HD videozapise iz Windows trgovine zahvaljujući nadolazećem ažuriranju za Microsoftovu aplikaciju Movies & TV. Kao...

Čitaj više
Microsoftov alat za ispravljanje pogrešaka u sustavu Windows PIX sada je dostupan za igre

Microsoftov alat za ispravljanje pogrešaka u sustavu Windows PIX sada je dostupan za igreMicrosoft

Programeri imaju na raspolaganju niz programa i alata koji im pomažu u održavanju i poboljšanju projekata. Mnogi od tih programa razlog su zbog kojih igra izgleda i osjeća se onako kako izgleda dok...

Čitaj više

Microsoft patentira uređaj s dvostrukim zaslonom s e-zaslonom za papirMicrosoft

Kao Microsoft priprema za prvijenac svog sljedeći mobitel - za koji se priča da je Surface Phone - div iz Redmonda nedavno je patentirao ono što naziva "Dvostruki zaslon”Koji ima redoviti zaslon s ...

Čitaj više