Kosmos-2 varētu būt revolucionārs Embodiment AI.
- Jauns pētījums, ko finansē Microsoft, iedziļinās AI fiziskumā.
- Valodas modelis Kosmos-2 tika apmācīts uztvert telpiskos jēdzienus.
- Tam ir arī savas zināšanas par kosmosu.
Microsoft pēdējā laikā ir ieguldījis lielu budžetu AI pētījumu finansēšanai. Orca 13B ir publiski pieejams pēc tam, kad Microsoft sapulcināta un finansēta pētnieku komanda to izveidoja.
LongMem ir Microsoft cerība uz neierobežotu konteksta garumu AI modeļos. Un tas ir arī pētniecības produkts, ko finansē Redmondā bāzētais tehnoloģiju gigants.
Phi-1, jauns valodas modelis kodēšanai, spēj patstāvīgi mācīties un attīstīt zināšanas. Microsoft finansēja pētījumu par to.
Un šķiet, ka AI iemiesojums ir nākamais AI izstrādes uzdevums. Bet Microsoft varētu vienkārši uzzināt atbildi ar citu AI pētījumu. Šoreiz runa ir par Kosmoss-2, jauns AI modelis, kas liek pamatu AI iemiesojumam.
Microsoft Kosmos-2 ir Embodiment AI prototips
Varbūt šī ir pirmā reize, kad dzirdat par AI iemiesojumu. Nu, nosaukums pats par sevi ir diezgan ierosinošs. Tātad, kas ir Embodiment AI, jūs varētu jautāt?
Embodiment AI ir mākslīgā intelekta joma, kas koncentrējas uz inteliģentu aģentu izstrādi, kuriem ir fizisks ķermenis un kuri var jēgpilni mijiedarboties ar pasauli.
Koncepcijas pamatā ir ideja, ka fiziskajam ķermenim ir nozīmīga loma tajā, kā aģents mācās un pieņem lēmumus.
Citiem vārdiem sakot, ja AI būtu ķermenis un tas kustētos, tad tas varētu mācīties no tā un reaģēt un veidot atbildes, kā arī attiecīgi mijiedarboties. Un, ja jūs domājat, ka mēs ieejam zinātniskās fantastikas teritorijā, pieturieties pie sava. AI vienmēr bija jākļūst par fizisku.
Saskaņā ar pētījumu Kosmos-2 ir valodas modelis, kas nodrošina jaunas iespējas uztvert objektu aprakstus (piemēram, ierobežojošos lodziņus) un iezemēt tekstu vizuālajā pasaulē. Pētnieki attēloja izteicienus kā saites Markdown, t.i., “teksta span”, kur objektu apraksti ir atrašanās vietas marķieru secības.
Kopā ar multimodālajiem korpusiem viņi izveidoja liela mēroga datus no iezemētiem attēla un teksta pāriem (ko sauc par GIT), lai apmācītu modeli. Papildus esošo MLLM iespēju integrēšanai Kosmos-2, modelis integrē arī zemējuma iespējas lietojumprogrammās.
Tas nozīmē, ka valoda ir spērusi soļus uz priekšu, lai uztvertu telpu un nāktu klajā ar savu uztveri, darbību un pasaules modelēšanu. Pētnieki uzskata, ka Kosmos-2 ir fiziskās AI pamats. Jūs varat izlasīt pētījumu šeit.
Ko jūs domājat par Microsoft Kosmos 2? Vai būtu labi, ja AI būtu fiziska forma vai nē? Paziņojiet mums tālāk komentāru sadaļā.