Microsoft Kosmos-2: Ako môže AI interagovať so svetom

Kosmos-2 by mohol byť revolučný pre Embodiment AI.

Nový výskum financovaný spoločnosťou Microsoft sa ponorí do fyzickosti AI.
Jazykový model Kosmos-2 bol trénovaný na vnímanie priestorových konceptov.
Prichádza aj s vlastnou znalosťou vesmíru.

Microsoft v poslednej dobe investuje veľa prostriedkov do financovania výskumu AI. Orca 13B je otvoreným zdrojom pre verejnosť po tom, čo ho zostavil tím výskumníkov, ktorý zostavil a financoval Microsoft.

LongMem je nádej Microsoftu na neobmedzenú dĺžku kontextu v modeloch AI. A je to tiež produkt výskumu financovaného technologickým gigantom so sídlom v Redmonde.

Phi-1, nový jazykový model pre kódovanie, je schopný samostatne sa učiť a rozvíjať vedomosti. Microsoft financoval výskum.

A zdá sa, že stelesnenie AI je ďalšou úlohou vo vývoji AI. Ale Microsoft môže mať odpoveď s ďalším výskumom AI. Tentoraz ide o Kozmos-2, nový model AI, ktorý kladie základy umelej inteligencie Embodiment AI.

Kosmos-2 od spoločnosti Microsoft je prototypom umelej inteligencie Embodiment

instagram story viewer

Možno je to prvýkrát, čo počujete o Embodiment AI. No, názov je sám o sebe dosť sugestívny. Čo je teda Embodiment AI, môžete sa opýtať?

Embodiment AI je oblasť umelej inteligencie, ktorá sa zameriava na vývoj inteligentných agentov, ktorí majú fyzické telo a dokážu zmysluplne interagovať so svetom.

Koncept je založený na myšlienke, že fyzické telo hrá významnú úlohu v tom, ako sa agent učí a robí rozhodnutia. microsoft kosmos 2

Inými slovami, ak by AI mala telo a pohybovala by sa, mohla by sa z toho poučiť a reagovať a vytvárať odpovede, ako aj podľa toho interagovať. A ak si myslíte, že vstupujeme na územie sci-fi, držte sa. AI sa vždy mala stať fyzickou.

Podľa výskumu je Kosmos-2 jazykovým modelom, ktorý umožňuje nové možnosti vnímania popisov objektov (napr. ohraničujúce rámčeky) a uzemňovania textu vo vizuálnom svete. Zastúpení výskumníci označujú výrazy ako odkazy v Markdown, t. j. „rozsah textu“, kde popisy objektov sú sekvencie tokenov polohy.

Spoločne s multimodálnymi korpusmi skonštruovali rozsiahle dáta uzemnených párov obrázkov a textu (nazývaných GrIT) na trénovanie modelu. Okrem integrácie existujúcich schopností MLLM v Kosmos-2 model integruje aj schopnosť uzemnenia do aplikácií.

To znamená, že jazyk urobil kroky vpred, aby vnímal priestor a prišiel s vlastným vnímaním, konaním a modelovaním sveta. Výskumníci si myslia, že Kosmos-2 je základom fyzickej AI. Môžete si prečítať výskum tu.

Čo si myslíte o Microsoft Kosmos 2? Bolo by dobré, keby AI mala fyzickú podobu alebo nie? Dajte nám vedieť v sekcii komentárov nižšie.

Microsoft Kosmos-2: Ako môže AI interagovať so svetom

Kosmos-2 by mohol byť revolučný pre Embodiment AI.

Kosmos-2 od spoločnosti Microsoft je prototypom umelej inteligencie Embodiment

Aktualizácia Windows 10 Anniversary Update zmarila zneužitie nulového dňa minulý rok pred vydaním opráv Microsoft Windows 10

Spoločnosť Microsoft oficiálne vyhlasuje vojnu robotickým hovorom Microsoft Robocalls

Microsoft začne z Windows Store odstraňovať aplikácie, ktoré nie sú v súlade s predpismi Microsoft Nevyhovujúce Aplikácie

Microsoft Kosmos-2: Ako môže AI interagovať so svetom

Kosmos-2 od spoločnosti Microsoft je prototypom umelej inteligencie Embodiment

Aktualizácia Windows 10 Anniversary Update zmarila zneužitie nulového dňa minulý rok pred vydaním oprávMicrosoftWindows 10

Spoločnosť Microsoft oficiálne vyhlasuje vojnu robotickým hovoromMicrosoftRobocalls

Microsoft začne z Windows Store odstraňovať aplikácie, ktoré nie sú v súlade s predpismiMicrosoftNevyhovujúce Aplikácie

Aktualizácia Windows 10 Anniversary Update zmarila zneužitie nulového dňa minulý rok pred vydaním opráv Microsoft Windows 10

Spoločnosť Microsoft oficiálne vyhlasuje vojnu robotickým hovorom Microsoft Robocalls

Microsoft začne z Windows Store odstraňovať aplikácie, ktoré nie sú v súlade s predpismi Microsoft Nevyhovujúce Aplikácie