Kosmos-2 by mohl být revoluční pro Embodiment AI.
- Nový výzkum financovaný společností Microsoft se ponoří do fyzičnosti umělé inteligence.
- Jazykový model Kosmos-2 byl vycvičen k vnímání prostorových konceptů.
- Přichází také s vlastní znalostí vesmíru.
Microsoft v poslední době investuje hodně peněz do financování výzkumu AI. Orca 13B je open source pro veřejnost poté, co jej vytvořil tým výzkumníků sestaven a financovaný společností Microsoft.
LongMem je naděje Microsoftu na neomezenou délku kontextu v modelech AI. A je to také produkt výzkumu financovaného technologickým gigantem se sídlem v Redmondu.
Phi-1, nový jazykový model pro kódování, je schopen samostatně se učit a rozvíjet znalosti. Microsoft financoval výzkum.
A zdá se, že Embodiment AI je dalším úkolem ve vývoji AI. Ale Microsoft by mohl mít odpověď s dalším výzkumem AI. Tentokrát jde o Kosmos-2, nový model umělé inteligence, který pokládá základy pro Embodiment AI.
Kosmos-2 od Microsoftu je prototypem Embodiment AI
Možná je to poprvé, co slyšíte o Embodiment AI. No, název je sám o sobě dost sugestivní. Takže co je Embodiment AI, můžete se zeptat?
Embodiment AI je obor umělé inteligence, který se zaměřuje na vývoj inteligentních agentů, kteří mají fyzické tělo a mohou smysluplně interagovat se světem.
Koncept je založen na myšlence, že fyzické tělo hraje významnou roli v tom, jak se agent učí a činí rozhodnutí.
Jinými slovy, pokud by umělá inteligence měla tělo a pohybovala by se, mohla by se z toho poučit a reagovat a tvořit odpovědi a také podle toho interagovat. A pokud si myslíte, že vstupujeme na území sci-fi, držte se. Umělá inteligence se vždy měla stát fyzickou.
Podle výzkumu je Kosmos-2 jazykový model, který umožňuje nové možnosti vnímání popisů objektů (např. ohraničujících rámečků) a uzemnění textu vizuálnímu světu. Zastoupení výzkumníci odkazují na výrazy v Markdown jako na odkazy, tedy „rozpětí textu“, kde popisy objektů jsou sekvence tokenů umístění.
Společně s multimodálními korpusy zkonstruovali rozsáhlá data z uzemněných párů obrázek-text (nazývaných GrIT) pro trénování modelu. Kromě integrace stávajících schopností MLLM v Kosmos-2 model také integruje schopnost uzemnění do aplikací.
To znamená, že jazyk učinil kroky kupředu k vnímání prostoru a přichází s vlastním vnímáním, jednáním a modelováním světa. Vědci si myslí, že Kosmos-2 je základem pro fyzickou AI. Můžete si přečíst výzkum tady.
Co si myslíte o Microsoft Kosmos 2? Bylo by dobré, kdyby AI měla fyzickou podobu nebo ne? Dejte nám vědět v sekci komentářů níže.