Kosmos-2 voisi olla vallankumouksellinen Embodiment AI: lle.
- Uusi Microsoftin rahoittama tutkimus tutkii tekoälyn fysikaalisuutta.
- Kielimalli Kosmos-2 koulutettiin hahmottamaan tilakäsitteitä.
- Sillä on myös oma tieto avaruudesta.
Microsoft on sijoittanut paljon budjettia tekoälytutkimuksen rahoittamiseen viime aikoina. Orca 13B on avoimen lähdekoodin yleisölle sen jälkeen, kun Microsoftin kokoama ja rahoittama tutkijaryhmä on rakentanut sen.
LongMem on Microsoftin toivo rajattomasta kontekstin pituudesta tekoälymalleissa. Ja se on myös Redmondissa toimivan teknologiajätin rahoittaman tutkimuksen tuote.
Phi-1, uusi kielimalli koodaukseen, pystyy oppimaan ja kehittämään tietoa itsenäisesti. Microsoft rahoitti tutkimuksen.
Ja näyttää siltä, että Embodiment AI on AI-kehityksen seuraava tehtävä. Mutta Microsoftilla saattaa olla vastaus toisella tekoälytutkimuksella. Tällä kertaa kyse Kosmos-2, uusi tekoälymalli, joka luo perustan Embodiment AI: lle.
Microsoftin Kosmos-2 on Embodiment AI -prototyyppi
Ehkä tämä on ensimmäinen kerta, kun kuulet Embodiment AI: stä. No, nimi on sinänsä aika vihjaileva. Joten mikä on Embodiment AI, saatat kysyä?
Embodiment AI on tekoälyn kenttä, joka keskittyy älykkäiden agenttien kehittämiseen, joilla on fyysinen keho ja jotka voivat olla vuorovaikutuksessa maailman kanssa mielekkäällä tavalla.
Konsepti perustuu ajatukseen, että fyysisellä keholla on merkittävä rooli siinä, kuinka agentti oppii ja tekee päätöksiä.
Toisin sanoen, jos tekoälyllä olisi keho ja se liikkuisi, se voisi oppia tästä ja vastata ja muodostaa vastauksia sekä olla vuorovaikutuksessa sen mukaisesti. Ja jos luulet, että astumme tieteiskirjallisuuden alueelle, pidä kiinni. Tekoälyn piti aina tulla fyysistä.
Tutkimuksen mukaan Kosmos-2 on kielimalli, joka mahdollistaa uusia kykyjä havaita esinekuvauksia (esim. rajoituslaatikoita) ja maadoittaa tekstiä visuaaliseen maailmaan. Tutkijat edustivat viittausilmaisuja linkkeinä Markdownissa, eli "tekstivälinä", jossa objektikuvaukset ovat paikkamerkkijonoja.
Yhdessä multimodaalisten korpujen kanssa he rakensivat suuren mittakaavan dataa maadoitetuista kuva-teksti-pareista (nimeltään GrIT) mallin kouluttamiseksi. Sen lisäksi, että malli integroi Kosmos-2:n olemassa olevat MLLM-ominaisuudet, se integroi myös maadoituskyvyn sovelluksiin.
Tämä tarkoittaa, että kieli on ottanut askeleita eteenpäin tilan havaitsemisessa ja oman havaintonsa, toimintansa ja maailmanmallinnuksensa keksimisessä. Tutkijoiden mielestä Kosmos-2 on fyysisen tekoälyn perusta. Voit lukea tutkimuksen tässä.
Mitä mieltä olet Microsoft Kosmos 2:sta? Olisiko hyvä, jos tekoälyllä olisi fyysinen muoto vai ei? Kerro meille alla olevassa kommenttiosassa.