Microsoft Kosmos-2: Hvordan AI kunne samhandle med verden

Kosmos-2 kan være revolusjonerende for Embodiment AI.

  • Ny forskning finansiert av Microsoft fordyper seg i AI-fyslighet.
  • Språkmodellen, Kosmos-2, ble opplært til å oppfatte romlige begreper.
  • Det kommer også med sin egen kunnskap om verdensrommet.
Microsoft kosmos 2

Microsoft har brukt mye budsjett på å finansiere AI-forskning i det siste. Orca 13B er åpen kildekode for publikum etter at et team av forskere samlet og finansiert av Microsoft bygde det.

LongMem er Microsofts håp om ubegrenset kontekstlengde i AI-modeller. Og det er også et produkt av forskning finansiert av den Redmond-baserte teknologigiganten.

Phi-1, en ny språkmodell for koding, er i stand til å lære og utvikle kunnskap på egen hånd. Microsoft finansierte forskningen for det.

Og det ser ut til at Embodiment AI er det neste oppdraget innen AI-utvikling. Men Microsoft har kanskje bare svaret med en annen forskning på AI. Denne gangen handler det om Kosmos-2, en ny AI-modell som legger grunnlaget for Embodiment AI.

Microsofts Kosmos-2 er Embodiment AI-prototypen

Kanskje dette er første gang du hører om Embodiment AI. Vel, navnet er ganske suggestivt i seg selv. Så hva er Embodiment AI, spør du kanskje?

Embodiment AI er et felt av kunstig intelligens som fokuserer på utviklingen av intelligente agenter som har en fysisk kropp og kan samhandle med verden på en meningsfull måte.

Konseptet er basert på ideen om at den fysiske kroppen spiller en betydelig rolle i hvordan en agent lærer og tar beslutninger.Microsoft kosmos 2

Med andre ord, hvis AI ville ha en kropp og ville bevege seg, så kunne den lære av dette og svare og danne svar, samt samhandle deretter. Og hvis du tror vi går inn i science fiction-territorium, hold stand. AI skulle alltid bli fysisk.

I følge forskningen er Kosmos-2 en språkmodell som muliggjør nye muligheter for å oppfatte objektbeskrivelser (f.eks. avgrensende bokser) og jorde tekst til den visuelle verden. Forskerne som er representert, refererer til uttrykk som lenker i Markdown, det vil si «tekstspenn», der objektbeskrivelser er sekvenser av plasseringstokens.

Sammen med multimodale korpus konstruerte de storskala data av jordede bilde-tekst-par (kalt GrIT) for å trene modellen. I tillegg til å integrere de eksisterende egenskapene til MLLM-er i Kosmos-2, integrerer modellen også jordingsevnen i applikasjoner.

Dette betyr at språket har tatt skritt fremover for å oppfatte rom og komme opp med sin egen oppfatning, handling og verdensmodellering. Forskerne tror på denne måten Kosmos-2 er grunnlaget for en fysisk AI. Du kan lese forskningen her.

Hva synes du om Microsoft Kosmos 2? Ville det være bra om AI har en fysisk form eller ikke? Gi oss beskjed i kommentarfeltet nedenfor.

GitHub blokkerer dev-kontoer fra amerikanske sanksjonerte land

GitHub blokkerer dev-kontoer fra amerikanske sanksjonerte landMicrosoftGithub

The United Stated har opphevet de kinesiske handelssanksjonene, men det ser ut til at handelskrigen ikke er over ennå. Nylig fant en russisk utvikler ut at han ikke lenger har tilgang til GitHub-ko...

Les mer
Microsoft kjøper Pull Panda for å forbedre kodevurderingen på GitHub

Microsoft kjøper Pull Panda for å forbedre kodevurderingen på GitHubMicrosoftGithub

Microsoft jobber med ta GitHub til neste nivå. Brukere kan nå opprette ubegrensede offentlige arkiver uten kostnad.Selskapet kunngjorde nylig at Pull Panda er den neste kandidaten til å bli med på ...

Les mer
Bruk GitHub Package Registry til å være vert for og publisere pakker raskere

Bruk GitHub Package Registry til å være vert for og publisere pakker raskereMicrosoftGithub

Microsoft lanserte en ny GitHub-pakke for programvareutviklere. Den nye pakken heter GitHub Package Registry. Det gjør det mulig for devs å publisere og administrere programvarepakker skrevet på fo...

Les mer