Microsoft Kosmos-2: Jak umělá inteligence mohla interagovat se světem

Kosmos-2 by mohl být revoluční pro Embodiment AI.

  • Nový výzkum financovaný společností Microsoft se ponoří do fyzičnosti umělé inteligence.
  • Jazykový model Kosmos-2 byl vycvičen k vnímání prostorových konceptů.
  • Přichází také s vlastní znalostí vesmíru.
microsoft kosmos 2

Microsoft v poslední době investuje hodně peněz do financování výzkumu AI. Orca 13B je open source pro veřejnost poté, co jej vytvořil tým výzkumníků sestaven a financovaný společností Microsoft.

LongMem je naděje Microsoftu na neomezenou délku kontextu v modelech AI. A je to také produkt výzkumu financovaného technologickým gigantem se sídlem v Redmondu.

Phi-1, nový jazykový model pro kódování, je schopen samostatně se učit a rozvíjet znalosti. Microsoft financoval výzkum.

A zdá se, že Embodiment AI je dalším úkolem ve vývoji AI. Ale Microsoft by mohl mít odpověď s dalším výzkumem AI. Tentokrát jde o Kosmos-2, nový model umělé inteligence, který pokládá základy pro Embodiment AI.

Kosmos-2 od Microsoftu je prototypem Embodiment AI

Možná je to poprvé, co slyšíte o Embodiment AI. No, název je sám o sobě dost sugestivní. Takže co je Embodiment AI, můžete se zeptat?

Embodiment AI je obor umělé inteligence, který se zaměřuje na vývoj inteligentních agentů, kteří mají fyzické tělo a mohou smysluplně interagovat se světem.

Koncept je založen na myšlence, že fyzické tělo hraje významnou roli v tom, jak se agent učí a činí rozhodnutí.microsoft kosmos 2

Jinými slovy, pokud by umělá inteligence měla tělo a pohybovala by se, mohla by se z toho poučit a reagovat a tvořit odpovědi a také podle toho interagovat. A pokud si myslíte, že vstupujeme na území sci-fi, držte se. Umělá inteligence se vždy měla stát fyzickou.

Podle výzkumu je Kosmos-2 jazykový model, který umožňuje nové možnosti vnímání popisů objektů (např. ohraničujících rámečků) a uzemnění textu vizuálnímu světu. Zastoupení výzkumníci odkazují na výrazy v Markdown jako na odkazy, tedy „rozpětí textu“, kde popisy objektů jsou sekvence tokenů umístění.

Společně s multimodálními korpusy zkonstruovali rozsáhlá data z uzemněných párů obrázek-text (nazývaných GrIT) pro trénování modelu. Kromě integrace stávajících schopností MLLM v Kosmos-2 model také integruje schopnost uzemnění do aplikací.

To znamená, že jazyk učinil kroky kupředu k vnímání prostoru a přichází s vlastním vnímáním, jednáním a modelováním světa. Vědci si myslí, že Kosmos-2 je základem pro fyzickou AI. Můžete si přečíst výzkum tady.

Co si myslíte o Microsoft Kosmos 2? Bylo by dobré, kdyby AI měla fyzickou podobu nebo ne? Dejte nám vědět v sekci komentářů níže.

Microsoft trvá na tom, že uživatelé mají na výběr, pokud jde o upgrade na Windows 10

Microsoft trvá na tom, že uživatelé mají na výběr, pokud jde o upgrade na Windows 10MicrosoftWindows 10

Za poslední dva měsíce internet zaplavily obvinění a stížnosti na těžkou strategii aktualizací systému Windows 10 společnosti Microsoft. Jedno téma bylo běžné: uživatelé obviňovali technologického ...

Přečtěte si více
Samsung a Microsoft uvádějí na trh inteligentní vysílačku pro pracoviště

Samsung a Microsoft uvádějí na trh inteligentní vysílačku pro pracovištěMicrosoftSamsungTýmy

Společnosti Samsung a Microsoft společně vyvinuly funkčnost chytrého telefonu s vysílačkou pro zlepšení komunikace na pracovišti mezi pracovníky první linie. Zaměstnanci budou mít k této funkci pří...

Přečtěte si více
Cloud Shell, odlehčená verze Windows, by mohla letos přistát

Cloud Shell, odlehčená verze Windows, by mohla letos přistátMicrosoftCloudová Skořápka

Před více než týdnem se objevily zprávy, které osvětlily plán společnosti Microsoft sjednotit Windows 10 zážitek pro uživatele jakéhokoli zařízení. Microsoft údajně volá projekt Composable Shell, n...

Přečtěte si více