Космос-2 может стать революционным для Embodiment AI.
- Новое исследование, финансируемое Microsoft, посвящено физическим свойствам ИИ.
- Языковая модель «Космос-2» была обучена воспринимать пространственные понятия.
- Он также приходит со своими знаниями о космосе.
В последнее время Microsoft вкладывает большие средства в финансирование исследований в области искусственного интеллекта. Орка 13Б является общедоступным исходным кодом после того, как команда исследователей, собранная и профинансированная Microsoft, создала его.
лонгмем — это надежда Microsoft на неограниченную длину контекста в моделях ИИ. И это также продукт исследований, финансируемых технологическим гигантом из Редмонда.
Фи-1, новая языковая модель для кодирования, способна самостоятельно учиться и развивать знания. Microsoft финансировала исследования для этого.
И кажется, что Embodiment AI — это следующий квест в развитии ИИ. Но у Microsoft может быть ответ в другом исследовании ИИ. На этот раз речь идет о Космос-2, новая модель ИИ, которая закладывает основу для Embodiment AI.
Kosmos-2 от Microsoft — прототип Embodiment AI
Возможно, вы впервые слышите о Embodiment AI. Что ж, название само по себе довольно многозначительно. Так что же такое Embodiment AI, спросите вы?
Embodiment AI — это область искусственного интеллекта, которая фокусируется на разработке интеллектуальных агентов, которые имеют физическое тело и могут осмысленно взаимодействовать с миром.
Концепция основана на идее, что физическое тело играет важную роль в том, как агент учится и принимает решения.
Другими словами, если бы у ИИ было тело и он мог бы двигаться, то он мог бы учиться на этом и реагировать и формировать ответы, а также соответствующим образом взаимодействовать. И если вы думаете, что мы вступаем на территорию научной фантастики, держитесь на месте. ИИ всегда должен был стать физическим.
Согласно исследованию, Космос-2 — это языковая модель, которая обеспечивает новые возможности восприятия описаний объектов (например, ограничивающих рамок) и привязки текста к визуальному миру. Исследователи представили выражения ссылок в виде ссылок в Markdown, то есть «текстового диапазона», где описания объектов представляют собой последовательности токенов местоположения.
Вместе с мультимодальными корпусами они создали крупномасштабные данные основанных пар изображение-текст (называемых GrIT) для обучения модели. Помимо интеграции существующих возможностей MLLM в «Космос-2», модель также интегрирует возможности заземления в приложения.
Это означает, что язык сделал шаг вперед в восприятии пространства и придумал собственное восприятие, действие и моделирование мира. Исследователи считают, что таким образом Космос-2 является основой для физического ИИ. Вы можете прочитать исследование здесь.
Что вы думаете о Microsoft Kosmos 2? Было бы хорошо, если бы у ИИ была физическая форма или нет? Дайте нам знать в комментариях ниже.