Microsoft Kosmos-2: Ako môže AI interagovať so svetom

Kosmos-2 by mohol byť revolučný pre Embodiment AI.

  • Nový výskum financovaný spoločnosťou Microsoft sa ponorí do fyzickosti AI.
  • Jazykový model Kosmos-2 bol trénovaný na vnímanie priestorových konceptov.
  • Prichádza aj s vlastnou znalosťou vesmíru.
microsoft kosmos 2

Microsoft v poslednej dobe investuje veľa prostriedkov do financovania výskumu AI. Orca 13B je otvoreným zdrojom pre verejnosť po tom, čo ho zostavil tím výskumníkov, ktorý zostavil a financoval Microsoft.

LongMem je nádej Microsoftu na neobmedzenú dĺžku kontextu v modeloch AI. A je to tiež produkt výskumu financovaného technologickým gigantom so sídlom v Redmonde.

Phi-1, nový jazykový model pre kódovanie, je schopný samostatne sa učiť a rozvíjať vedomosti. Microsoft financoval výskum.

A zdá sa, že stelesnenie AI je ďalšou úlohou vo vývoji AI. Ale Microsoft môže mať odpoveď s ďalším výskumom AI. Tentoraz ide o Kozmos-2, nový model AI, ktorý kladie základy umelej inteligencie Embodiment AI.

Kosmos-2 od spoločnosti Microsoft je prototypom umelej inteligencie Embodiment

Možno je to prvýkrát, čo počujete o Embodiment AI. No, názov je sám o sebe dosť sugestívny. Čo je teda Embodiment AI, môžete sa opýtať?

Embodiment AI je oblasť umelej inteligencie, ktorá sa zameriava na vývoj inteligentných agentov, ktorí majú fyzické telo a dokážu zmysluplne interagovať so svetom.

Koncept je založený na myšlienke, že fyzické telo hrá významnú úlohu v tom, ako sa agent učí a robí rozhodnutia.microsoft kosmos 2

Inými slovami, ak by AI mala telo a pohybovala by sa, mohla by sa z toho poučiť a reagovať a vytvárať odpovede, ako aj podľa toho interagovať. A ak si myslíte, že vstupujeme na územie sci-fi, držte sa. AI sa vždy mala stať fyzickou.

Podľa výskumu je Kosmos-2 jazykovým modelom, ktorý umožňuje nové možnosti vnímania popisov objektov (napr. ohraničujúce rámčeky) a uzemňovania textu vo vizuálnom svete. Zastúpení výskumníci označujú výrazy ako odkazy v Markdown, t. j. „rozsah textu“, kde popisy objektov sú sekvencie tokenov polohy.

Spoločne s multimodálnymi korpusmi skonštruovali rozsiahle dáta uzemnených párov obrázkov a textu (nazývaných GrIT) na trénovanie modelu. Okrem integrácie existujúcich schopností MLLM v Kosmos-2 model integruje aj schopnosť uzemnenia do aplikácií.

To znamená, že jazyk urobil kroky vpred, aby vnímal priestor a prišiel s vlastným vnímaním, konaním a modelovaním sveta. Výskumníci si myslia, že Kosmos-2 je základom fyzickej AI. Môžete si prečítať výskum tu.

Čo si myslíte o Microsoft Kosmos 2? Bolo by dobré, keby AI mala fyzickú podobu alebo nie? Dajte nám vedieť v sekcii komentárov nižšie.

Spoločnosť Microsoft umožňuje používateľom hlásiť nenávistné prejavy prostredníctvom špecializovaných webových formulárov

Spoločnosť Microsoft umožňuje používateľom hlásiť nenávistné prejavy prostredníctvom špecializovaných webových formulárovMicrosoft

Microsoft oznámila, že vydala nový špecializovaný webový formulár, s ktorým môžu používatelia hlásiť nenávistné prejavy. Okrem toho existuje aj samostatný webový formulár pre žiadosti o prehodnoten...

Čítaj viac
Microsoft pracuje na cloude „Windows 365“ na základe predplatného modelu

Microsoft pracuje na cloude „Windows 365“ na základe predplatného modeluMicrosoft

Nie je to prvýkrát, čo počujeme o Microsoftu, ktorý pracuje na cloudovej verzii systému Windows, ale je to prvýkrát, čo vidíme meno - Windows 365, vďaka čínskemu úniku informácií.Ako sami vidíte na...

Čítaj viac
Spoločnosť Microsoft plánuje nahradiť heslo mobilnou autentifikáciou

Spoločnosť Microsoft plánuje nahradiť heslo mobilnou autentifikáciouMicrosoft

Aj keby to malo už dávno pominúť, heslo dokázalo zostať nažive už viac ako 20 rokov. Bill Gates vyhlásil heslo passé už v roku 2004, ale až koncom apríla 2017 sa spoločnosti, ktorú založil, podaril...

Čítaj viac