Kosmos-2 võib olla Embodiment AI jaoks revolutsiooniline.
- Microsofti rahastatud uus uuring käsitleb tehisintellekti füüsilist olemust.
- Keelemudelit Kosmos-2 treeniti ruumimõistete tajumiseks.
- Sellega kaasnevad ka oma teadmised ruumist.
Microsoft on viimasel ajal panustanud tehisintellektiuuringute rahastamisele palju eelarvet. Orca 13B on avalikkusele avatud lähtekoodiga pärast seda, kui Microsofti koostatud ja rahastatud teadlaste meeskond selle ehitas.
LongMem on Microsofti lootus AI mudelite piiramatule kontekstipikkusele. Ja see on ka Redmondis asuva tehnoloogiahiiglase rahastatud uurimistöö toode.
Phi-1, uus kodeerimise keelemudel, on võimeline iseseisvalt õppima ja teadmisi arendama. Microsoft rahastas selle jaoks uurimistööd.
Ja tundub, et Embodiment AI on AI arenduse järgmine ülesanne. Kuid Microsoft võib vastuse saada mõne teise AI-uuringuga. Seekord on juttu Kosmos-2, uus tehisintellekti mudel, mis paneb aluse Embodiment AI-le.
Microsofti Kosmos-2 on Embodiment AI prototüüp
Võib-olla kuulete Embodiment AI-st esimest korda. Noh, nimi on iseenesest üsna sugestiivne. Nii et mis on Embodiment AI, võite küsida?
Embodiment AI on tehisintellekti valdkond, mis keskendub intelligentsete agentide arendamisele, millel on füüsiline keha ja mis suudavad maailmaga tähendusrikkalt suhelda.
Kontseptsioon põhineb ideel, et füüsiline keha mängib olulist rolli selles, kuidas agent õpib ja otsuseid teeb.
Teisisõnu, kui tehisintellektil oleks keha ja see liiguks, saaks ta sellest õppida ning reageerida ja vastuseid kujundada ning ka vastavalt suhelda. Ja kui arvate, et siseneme ulme territooriumile, hoidke oma seisukohta. AI pidi alati muutuma füüsiliseks.
Uuringu kohaselt on Kosmos-2 keelemudel, mis võimaldab uusi võimalusi tajuda objektide kirjeldusi (nt piirdekastid) ja maandada teksti visuaalsesse maailma. Teadlased viitasid väljenditele Markdownis linkidena, st "tekstivahemikuna", kus objektide kirjeldused on asukohamärkide jadad.
Koos multimodaalsete korpustega koostasid nad mudeli koolitamiseks maandatud pildi-teksti paaride (nn GrIT) suuremahulisi andmeid. Lisaks Kosmos-2 olemasolevate MLLM-ide võimaluste integreerimisele integreerib mudel rakendustesse ka maandusvõimaluse.
See tähendab, et keel on astunud samme edasi, et tajuda ruumi ning tulla välja oma taju, tegevuse ja maailma modelleerimisega. Teadlased arvavad, et Kosmos-2 on füüsilise AI alus. Saate lugeda uuringut siin.
Mida arvate Microsoft Kosmos 2-st? Kas oleks hea, kui tehisintellektil oleks füüsiline vorm või mitte? Andke meile teada allpool olevas kommentaaride jaotises.