Microsoft Kosmos-2: Kuinka tekoäly voisi olla vuorovaikutuksessa maailman kanssa

Kosmos-2 voisi olla vallankumouksellinen Embodiment AI: lle.

  • Uusi Microsoftin rahoittama tutkimus tutkii tekoälyn fysikaalisuutta.
  • Kielimalli Kosmos-2 koulutettiin hahmottamaan tilakäsitteitä.
  • Sillä on myös oma tieto avaruudesta.
Microsoft kosmos 2

Microsoft on sijoittanut paljon budjettia tekoälytutkimuksen rahoittamiseen viime aikoina. Orca 13B on avoimen lähdekoodin yleisölle sen jälkeen, kun Microsoftin kokoama ja rahoittama tutkijaryhmä on rakentanut sen.

LongMem on Microsoftin toivo rajattomasta kontekstin pituudesta tekoälymalleissa. Ja se on myös Redmondissa toimivan teknologiajätin rahoittaman tutkimuksen tuote.

Phi-1, uusi kielimalli koodaukseen, pystyy oppimaan ja kehittämään tietoa itsenäisesti. Microsoft rahoitti tutkimuksen.

Ja näyttää siltä, ​​että Embodiment AI on AI-kehityksen seuraava tehtävä. Mutta Microsoftilla saattaa olla vastaus toisella tekoälytutkimuksella. Tällä kertaa kyse Kosmos-2, uusi tekoälymalli, joka luo perustan Embodiment AI: lle.

Microsoftin Kosmos-2 on Embodiment AI -prototyyppi

Ehkä tämä on ensimmäinen kerta, kun kuulet Embodiment AI: stä. No, nimi on sinänsä aika vihjaileva. Joten mikä on Embodiment AI, saatat kysyä?

Embodiment AI on tekoälyn kenttä, joka keskittyy älykkäiden agenttien kehittämiseen, joilla on fyysinen keho ja jotka voivat olla vuorovaikutuksessa maailman kanssa mielekkäällä tavalla.

Konsepti perustuu ajatukseen, että fyysisellä keholla on merkittävä rooli siinä, kuinka agentti oppii ja tekee päätöksiä.Microsoft kosmos 2

Toisin sanoen, jos tekoälyllä olisi keho ja se liikkuisi, se voisi oppia tästä ja vastata ja muodostaa vastauksia sekä olla vuorovaikutuksessa sen mukaisesti. Ja jos luulet, että astumme tieteiskirjallisuuden alueelle, pidä kiinni. Tekoälyn piti aina tulla fyysistä.

Tutkimuksen mukaan Kosmos-2 on kielimalli, joka mahdollistaa uusia kykyjä havaita esinekuvauksia (esim. rajoituslaatikoita) ja maadoittaa tekstiä visuaaliseen maailmaan. Tutkijat edustivat viittausilmaisuja linkkeinä Markdownissa, eli "tekstivälinä", jossa objektikuvaukset ovat paikkamerkkijonoja.

Yhdessä multimodaalisten korpujen kanssa he rakensivat suuren mittakaavan dataa maadoitetuista kuva-teksti-pareista (nimeltään GrIT) mallin kouluttamiseksi. Sen lisäksi, että malli integroi Kosmos-2:n olemassa olevat MLLM-ominaisuudet, se integroi myös maadoituskyvyn sovelluksiin.

Tämä tarkoittaa, että kieli on ottanut askeleita eteenpäin tilan havaitsemisessa ja oman havaintonsa, toimintansa ja maailmanmallinnuksensa keksimisessä. Tutkijoiden mielestä Kosmos-2 on fyysisen tekoälyn perusta. Voit lukea tutkimuksen tässä.

Mitä mieltä olet Microsoft Kosmos 2:sta? Olisiko hyvä, jos tekoälyllä olisi fyysinen muoto vai ei? Kerro meille alla olevassa kommenttiosassa.

20 yllättävää faktaa ja tilastoa Google Drivesta, joita et tiennyt

20 yllättävää faktaa ja tilastoa Google Drivesta, joita et tiennytMicrosoftWindows 11Google Asema

Google Drive on laajalti käytetty ja suosittu tiedostonjakopalvelu.Kymmenen vuoden aikana Drive on käynyt läpi monia muutoksia ja kasvanut eksponentiaalisesti.Tässä oppaassa luetellaan 20 yllättävä...

Lue lisää
Mikä on Microsoft Dev Box ja kuinka voit käyttää sitä

Mikä on Microsoft Dev Box ja kuinka voit käyttää sitäMicrosoftWindows 365TaivaansininenKehittäjät

Windows 365:n hallinnoima ja Azuressa isännöity uusi pilvityöasema helpottaa uuden virtuaalikoneen luomista kehittäjille. Se tarkoittaa, että Microsoft Dev Box toimii kaikkien Windows-selaimien kan...

Lue lisää
Mikä on Microsoft Power Pages ja kuinka voit käyttää sitä?

Mikä on Microsoft Power Pages ja kuinka voit käyttää sitä?MicrosoftPowerapps

Microsoft Power Pages julkaistiin äskettäin vaihtoehtona matalakoodaajille verkkosivustojen suunnittelussa.Power Pages integroituu muihin palveluihin, kuten Azure DevOpsiin, muun muassa työnkulkuje...

Lue lisää