Microsoft Kosmos-2: Ako môže AI interagovať so svetom

Kosmos-2 by mohol byť revolučný pre Embodiment AI.

  • Nový výskum financovaný spoločnosťou Microsoft sa ponorí do fyzickosti AI.
  • Jazykový model Kosmos-2 bol trénovaný na vnímanie priestorových konceptov.
  • Prichádza aj s vlastnou znalosťou vesmíru.
microsoft kosmos 2

Microsoft v poslednej dobe investuje veľa prostriedkov do financovania výskumu AI. Orca 13B je otvoreným zdrojom pre verejnosť po tom, čo ho zostavil tím výskumníkov, ktorý zostavil a financoval Microsoft.

LongMem je nádej Microsoftu na neobmedzenú dĺžku kontextu v modeloch AI. A je to tiež produkt výskumu financovaného technologickým gigantom so sídlom v Redmonde.

Phi-1, nový jazykový model pre kódovanie, je schopný samostatne sa učiť a rozvíjať vedomosti. Microsoft financoval výskum.

A zdá sa, že stelesnenie AI je ďalšou úlohou vo vývoji AI. Ale Microsoft môže mať odpoveď s ďalším výskumom AI. Tentoraz ide o Kozmos-2, nový model AI, ktorý kladie základy umelej inteligencie Embodiment AI.

Kosmos-2 od spoločnosti Microsoft je prototypom umelej inteligencie Embodiment

Možno je to prvýkrát, čo počujete o Embodiment AI. No, názov je sám o sebe dosť sugestívny. Čo je teda Embodiment AI, môžete sa opýtať?

Embodiment AI je oblasť umelej inteligencie, ktorá sa zameriava na vývoj inteligentných agentov, ktorí majú fyzické telo a dokážu zmysluplne interagovať so svetom.

Koncept je založený na myšlienke, že fyzické telo hrá významnú úlohu v tom, ako sa agent učí a robí rozhodnutia.microsoft kosmos 2

Inými slovami, ak by AI mala telo a pohybovala by sa, mohla by sa z toho poučiť a reagovať a vytvárať odpovede, ako aj podľa toho interagovať. A ak si myslíte, že vstupujeme na územie sci-fi, držte sa. AI sa vždy mala stať fyzickou.

Podľa výskumu je Kosmos-2 jazykovým modelom, ktorý umožňuje nové možnosti vnímania popisov objektov (napr. ohraničujúce rámčeky) a uzemňovania textu vo vizuálnom svete. Zastúpení výskumníci označujú výrazy ako odkazy v Markdown, t. j. „rozsah textu“, kde popisy objektov sú sekvencie tokenov polohy.

Spoločne s multimodálnymi korpusmi skonštruovali rozsiahle dáta uzemnených párov obrázkov a textu (nazývaných GrIT) na trénovanie modelu. Okrem integrácie existujúcich schopností MLLM v Kosmos-2 model integruje aj schopnosť uzemnenia do aplikácií.

To znamená, že jazyk urobil kroky vpred, aby vnímal priestor a prišiel s vlastným vnímaním, konaním a modelovaním sveta. Výskumníci si myslia, že Kosmos-2 je základom fyzickej AI. Môžete si prečítať výskum tu.

Čo si myslíte o Microsoft Kosmos 2? Bolo by dobré, keby AI mala fyzickú podobu alebo nie? Dajte nám vedieť v sekcii komentárov nižšie.

Aktualizácia Windows 10 Anniversary Update zmarila zneužitie nulového dňa minulý rok pred vydaním opráv

Aktualizácia Windows 10 Anniversary Update zmarila zneužitie nulového dňa minulý rok pred vydaním oprávMicrosoftWindows 10

Zabezpečenie je hlavným predajným miestom spoločnosti Microsoft pre najnovšiu verziu operačného systému pre stolné počítače. Softvérový gigant teraz opätovne zdôrazňuje, že to s týmto cieľom myslí ...

Čítaj viac
Spoločnosť Microsoft oficiálne vyhlasuje vojnu robotickým hovorom

Spoločnosť Microsoft oficiálne vyhlasuje vojnu robotickým hovoromMicrosoftRobocalls

Všetci nenávidíme robocaly! Tieto nepríjemné automatizované telefónne hovory doručovať zaznamenané správy a zvyčajne propagovať výrobky alebo služby alebo dokonca politickú stranu. Na základe sťažn...

Čítaj viac
Microsoft začne z Windows Store odstraňovať aplikácie, ktoré nie sú v súlade s predpismi

Microsoft začne z Windows Store odstraňovať aplikácie, ktoré nie sú v súlade s predpismiMicrosoftNevyhovujúce Aplikácie

Microsoft nepretržite varuje vývojárov pred nastavením presných vekových hodnotení pre aplikácie zverejnené v obchode Windows. Ak nie sú v súlade so systémom International Age Rating Coalition (IAR...

Čítaj viac