Kosmos-2 by mohol byť revolučný pre Embodiment AI.
- Nový výskum financovaný spoločnosťou Microsoft sa ponorí do fyzickosti AI.
- Jazykový model Kosmos-2 bol trénovaný na vnímanie priestorových konceptov.
- Prichádza aj s vlastnou znalosťou vesmíru.
Microsoft v poslednej dobe investuje veľa prostriedkov do financovania výskumu AI. Orca 13B je otvoreným zdrojom pre verejnosť po tom, čo ho zostavil tím výskumníkov, ktorý zostavil a financoval Microsoft.
LongMem je nádej Microsoftu na neobmedzenú dĺžku kontextu v modeloch AI. A je to tiež produkt výskumu financovaného technologickým gigantom so sídlom v Redmonde.
Phi-1, nový jazykový model pre kódovanie, je schopný samostatne sa učiť a rozvíjať vedomosti. Microsoft financoval výskum.
A zdá sa, že stelesnenie AI je ďalšou úlohou vo vývoji AI. Ale Microsoft môže mať odpoveď s ďalším výskumom AI. Tentoraz ide o Kozmos-2, nový model AI, ktorý kladie základy umelej inteligencie Embodiment AI.
Kosmos-2 od spoločnosti Microsoft je prototypom umelej inteligencie Embodiment
Možno je to prvýkrát, čo počujete o Embodiment AI. No, názov je sám o sebe dosť sugestívny. Čo je teda Embodiment AI, môžete sa opýtať?
Embodiment AI je oblasť umelej inteligencie, ktorá sa zameriava na vývoj inteligentných agentov, ktorí majú fyzické telo a dokážu zmysluplne interagovať so svetom.
Koncept je založený na myšlienke, že fyzické telo hrá významnú úlohu v tom, ako sa agent učí a robí rozhodnutia.
Inými slovami, ak by AI mala telo a pohybovala by sa, mohla by sa z toho poučiť a reagovať a vytvárať odpovede, ako aj podľa toho interagovať. A ak si myslíte, že vstupujeme na územie sci-fi, držte sa. AI sa vždy mala stať fyzickou.
Podľa výskumu je Kosmos-2 jazykovým modelom, ktorý umožňuje nové možnosti vnímania popisov objektov (napr. ohraničujúce rámčeky) a uzemňovania textu vo vizuálnom svete. Zastúpení výskumníci označujú výrazy ako odkazy v Markdown, t. j. „rozsah textu“, kde popisy objektov sú sekvencie tokenov polohy.
Spoločne s multimodálnymi korpusmi skonštruovali rozsiahle dáta uzemnených párov obrázkov a textu (nazývaných GrIT) na trénovanie modelu. Okrem integrácie existujúcich schopností MLLM v Kosmos-2 model integruje aj schopnosť uzemnenia do aplikácií.
To znamená, že jazyk urobil kroky vpred, aby vnímal priestor a prišiel s vlastným vnímaním, konaním a modelovaním sveta. Výskumníci si myslia, že Kosmos-2 je základom fyzickej AI. Môžete si prečítať výskum tu.
Čo si myslíte o Microsoft Kosmos 2? Bolo by dobré, keby AI mala fyzickú podobu alebo nie? Dajte nám vedieť v sekcii komentárov nižšie.