Microsoft Kosmos-2: Jak umělá inteligence mohla interagovat se světem

Kosmos-2 by mohl být revoluční pro Embodiment AI.

  • Nový výzkum financovaný společností Microsoft se ponoří do fyzičnosti umělé inteligence.
  • Jazykový model Kosmos-2 byl vycvičen k vnímání prostorových konceptů.
  • Přichází také s vlastní znalostí vesmíru.
microsoft kosmos 2

Microsoft v poslední době investuje hodně peněz do financování výzkumu AI. Orca 13B je open source pro veřejnost poté, co jej vytvořil tým výzkumníků sestaven a financovaný společností Microsoft.

LongMem je naděje Microsoftu na neomezenou délku kontextu v modelech AI. A je to také produkt výzkumu financovaného technologickým gigantem se sídlem v Redmondu.

Phi-1, nový jazykový model pro kódování, je schopen samostatně se učit a rozvíjet znalosti. Microsoft financoval výzkum.

A zdá se, že Embodiment AI je dalším úkolem ve vývoji AI. Ale Microsoft by mohl mít odpověď s dalším výzkumem AI. Tentokrát jde o Kosmos-2, nový model umělé inteligence, který pokládá základy pro Embodiment AI.

Kosmos-2 od Microsoftu je prototypem Embodiment AI

Možná je to poprvé, co slyšíte o Embodiment AI. No, název je sám o sobě dost sugestivní. Takže co je Embodiment AI, můžete se zeptat?

Embodiment AI je obor umělé inteligence, který se zaměřuje na vývoj inteligentních agentů, kteří mají fyzické tělo a mohou smysluplně interagovat se světem.

Koncept je založen na myšlence, že fyzické tělo hraje významnou roli v tom, jak se agent učí a činí rozhodnutí.microsoft kosmos 2

Jinými slovy, pokud by umělá inteligence měla tělo a pohybovala by se, mohla by se z toho poučit a reagovat a tvořit odpovědi a také podle toho interagovat. A pokud si myslíte, že vstupujeme na území sci-fi, držte se. Umělá inteligence se vždy měla stát fyzickou.

Podle výzkumu je Kosmos-2 jazykový model, který umožňuje nové možnosti vnímání popisů objektů (např. ohraničujících rámečků) a uzemnění textu vizuálnímu světu. Zastoupení výzkumníci odkazují na výrazy v Markdown jako na odkazy, tedy „rozpětí textu“, kde popisy objektů jsou sekvence tokenů umístění.

Společně s multimodálními korpusy zkonstruovali rozsáhlá data z uzemněných párů obrázek-text (nazývaných GrIT) pro trénování modelu. Kromě integrace stávajících schopností MLLM v Kosmos-2 model také integruje schopnost uzemnění do aplikací.

To znamená, že jazyk učinil kroky kupředu k vnímání prostoru a přichází s vlastním vnímáním, jednáním a modelováním světa. Vědci si myslí, že Kosmos-2 je základem pro fyzickou AI. Můžete si přečíst výzkum tady.

Co si myslíte o Microsoft Kosmos 2? Bylo by dobré, kdyby AI měla fyzickou podobu nebo ne? Dejte nám vědět v sekci komentářů níže.

Microsoft údajně otevře Orca 13B

Microsoft údajně otevře Orca 13BMicrosoft

Budete to moci studovat a vytvořit si vlastní model umělé inteligence.Výzkum společnosti Microsoft ukazuje, jak malé modely umělé inteligence soupeří s těmi velkými.Orca je malý model umělé intelig...

Přečtěte si více
Plán Xbox Studios: jaké hry můžete očekávat v letech 2023 a 2024

Plán Xbox Studios: jaké hry můžete očekávat v letech 2023 a 2024MicrosoftXbox

Očekávejte, že na Xbox přijdou úžasné tituly.V roce 2023 a 2024 přichází na Xbox mnoho nových titulů.Fable, Everwild a Age of Mythology: Retold jsou některé z nich.Na plánu je také projekt Kojima P...

Přečtěte si více
Co je Microsoft Xbox Research Console?

Co je Microsoft Xbox Research Console?MicrosoftXbox

Microsoft Research Xbox je varianta Xbox 360.Byl postaven a uveden na trh v roce 2012. Dodává se s doprovodnou funkcí a můžete jej připojit k dalším zařízením.Dá se to najít, ale je to dost drahé.T...

Přečtěte si více