Kosmos-2 zou revolutionair kunnen zijn voor Embodiment AI.
- Nieuw onderzoek gefinancierd door Microsoft duikt in de lichamelijkheid van AI.
- Het taalmodel, Kosmos-2, is getraind om ruimtelijke concepten waar te nemen.
- Het komt ook met zijn eigen kennis van de ruimte.

Microsoft heeft de laatste tijd veel geld gestoken in het financieren van AI-onderzoek. Orka 13B is open source voor het publiek nadat een team van onderzoekers, samengesteld en gefinancierd door Microsoft, het heeft gebouwd.
LangMem is de hoop van Microsoft op onbeperkte contextlengte in AI-modellen. En het is ook een product van onderzoek dat wordt gefinancierd door de in Redmond gevestigde technologiegigant.
Phi-1, een nieuw taalmodel voor coderen, is in staat om zelfstandig kennis te leren en te ontwikkelen. Microsoft financierde het onderzoek ervoor.
En het lijkt erop dat Embodiment AI de volgende zoektocht is in AI-ontwikkeling. Maar Microsoft heeft misschien wel het antwoord met een ander onderzoek naar AI. Deze keer gaat het over Kosmos-2, een nieuw AI-model dat de basis legt voor Embodiment AI.
Microsoft's Kosmos-2 is het prototype van Embodiment AI
Misschien is dit de eerste keer dat u over Embodiment AI hoort. Nou, de naam is op zich al behoorlijk suggestief. Dus wat is Embodiment AI, vraag je je misschien af?
Uitvoeringsvorm AI is een gebied van kunstmatige intelligentie dat zich richt op de ontwikkeling van intelligente agenten die een fysiek lichaam hebben en op een zinvolle manier met de wereld kunnen communiceren.
Het concept is gebaseerd op het idee dat het fysieke lichaam een belangrijke rol speelt in hoe een agent leert en beslissingen neemt.
Met andere woorden, als AI een lichaam zou hebben en zou bewegen, dan zou het hiervan kunnen leren en kunnen reageren en antwoorden kunnen vormen, en dienovereenkomstig kunnen communiceren. En als je denkt dat we sciencefiction-territorium betreden, houd stand. AI moest altijd fysiek worden.
Volgens het onderzoek is Kosmos-2 een taalmodel dat nieuwe mogelijkheden biedt voor het waarnemen van objectbeschrijvingen (bijvoorbeeld begrenzingskaders) en het aarden van tekst in de visuele wereld. De onderzoekers vertegenwoordigden verwijzingsuitdrukkingen als links in Markdown, d.w.z. "tekstbereik", waarbij objectbeschrijvingen reeksen locatietokens zijn.
Samen met multimodale corpora construeerden ze grootschalige gegevens van geaarde beeld-tekstparen (GrIT genoemd) om het model te trainen. Naast de integratie van de bestaande mogelijkheden van MLLM's in Kosmos-2, integreert het model ook de aardingsmogelijkheden in applicaties.
Dit betekent dat de taal stappen vooruit heeft gezet in het waarnemen van ruimte en het bedenken van zijn eigen perceptie, actie en wereldmodellering. De onderzoekers denken zo dat Kosmos-2 de basis is voor een fysieke AI. U kunt het onderzoek lezen hier.
Wat vind je van Microsoft Kosmos 2? Zou het goed zijn als AI een fysieke vorm heeft of niet? Laat het ons weten in de comments hieronder.