Kosmos-2 може да бъде революционен за Embodiment AI.
- Ново изследване, финансирано от Microsoft, се занимава с физичността на AI.
- Езиковият модел, Космос-2, беше обучен да възприема пространствени концепции.
- Той също така идва със собствените си познания за космоса.
Напоследък Microsoft отделя много бюджет за финансиране на изследвания на AI. Orca 13B е с отворен код за обществеността, след като екип от изследователи, събрани и финансирани от Microsoft, го изградиха.
LongMem е надеждата на Microsoft за неограничена дължина на контекста в AI модели. Освен това е продукт на изследвания, финансирани от базирания в Редмънд технологичен гигант.
Фи-1, нов езиков модел за кодиране, е способен сам да учи и развива знания. Microsoft финансира изследването за него.
И изглежда, че Embodiment AI е следващото търсене в развитието на AI. Но Microsoft може просто да има отговора с друго изследване на AI. Този път става дума за Космос-2, нов AI модел, който полага основите на Embodiment AI.
Kosmos-2 на Microsoft е прототипът на Embodiment AI
Може би това е първият път, когато чувате за Embodiment AI. Е, името само по себе си е доста внушително. И така, какво е Embodiment AI, може да попитате?
Embodiment AI е област на изкуствения интелект, която се фокусира върху разработването на интелигентни агенти, които имат физическо тяло и могат да взаимодействат със света по смислен начин.
Концепцията се основава на идеята, че физическото тяло играе важна роля в начина, по който агентът учи и взема решения.
С други думи, ако изкуственият интелект има тяло и се движи, тогава той би могъл да се учи от това и да реагира и да формира отговори, както и да взаимодейства съответно. И ако мислите, че навлизаме в територията на научната фантастика, дръжте се. AI винаги е трябвало да стане физически.
Според изследването Kosmos-2 е езиков модел, който позволява нови възможности за възприемане на описания на обекти (напр. ограничаващи полета) и заземяване на текст във визуалния свят. Представените изследователи препращат към изрази като връзки в Markdown, т.е. „текстов обхват“, където описанията на обекти са последователности от жетони за местоположение.
Заедно с мултимодални корпуси, те конструираха широкомащабни данни от заземени двойки изображение-текст (наречени GrIT), за да обучат модела. В допълнение към интегрирането на съществуващите възможности на MLLM в Kosmos-2, моделът също интегрира възможността за заземяване в приложенията.
Това означава, че езикът е направил стъпки напред във възприемането на пространството и е измислил собствено възприятие, действие и моделиране на света. Изследователите смятат, че по този начин Космос-2 е основата за физически ИИ. Можете да прочетете изследването тук.
Какво мислите за Microsoft Kosmos 2? Ще бъде ли добре, ако AI има физическа форма или не? Уведомете ни в секцията за коментари по-долу.