Microsoft Kosmos-2: как ИИ может взаимодействовать с миром

Космос-2 может стать революционным для Embodiment AI.

  • Новое исследование, финансируемое Microsoft, посвящено физическим свойствам ИИ.
  • Языковая модель «Космос-2» была обучена воспринимать пространственные понятия.
  • Он также приходит со своими знаниями о космосе.
майкрософт космос 2

В последнее время Microsoft вкладывает большие средства в финансирование исследований в области искусственного интеллекта. Орка 13Б является общедоступным исходным кодом после того, как команда исследователей, собранная и профинансированная Microsoft, создала его.

лонгмем — это надежда Microsoft на неограниченную длину контекста в моделях ИИ. И это также продукт исследований, финансируемых технологическим гигантом из Редмонда.

Фи-1, новая языковая модель для кодирования, способна самостоятельно учиться и развивать знания. Microsoft финансировала исследования для этого.

И кажется, что Embodiment AI — это следующий квест в развитии ИИ. Но у Microsoft может быть ответ в другом исследовании ИИ. На этот раз речь идет о Космос-2, новая модель ИИ, которая закладывает основу для Embodiment AI.

Kosmos-2 от Microsoft — прототип Embodiment AI

Возможно, вы впервые слышите о Embodiment AI. Что ж, название само по себе довольно многозначительно. Так что же такое Embodiment AI, спросите вы?

Embodiment AI — это область искусственного интеллекта, которая фокусируется на разработке интеллектуальных агентов, которые имеют физическое тело и могут осмысленно взаимодействовать с миром.

Концепция основана на идее, что физическое тело играет важную роль в том, как агент учится и принимает решения.майкрософт космос 2

Другими словами, если бы у ИИ было тело и он мог бы двигаться, то он мог бы учиться на этом и реагировать и формировать ответы, а также соответствующим образом взаимодействовать. И если вы думаете, что мы вступаем на территорию научной фантастики, держитесь на месте. ИИ всегда должен был стать физическим.

Согласно исследованию, Космос-2 — это языковая модель, которая обеспечивает новые возможности восприятия описаний объектов (например, ограничивающих рамок) и привязки текста к визуальному миру. Исследователи представили выражения ссылок в виде ссылок в Markdown, то есть «текстового диапазона», где описания объектов представляют собой последовательности токенов местоположения.

Вместе с мультимодальными корпусами они создали крупномасштабные данные основанных пар изображение-текст (называемых GrIT) для обучения модели. Помимо интеграции существующих возможностей MLLM в «Космос-2», модель также интегрирует возможности заземления в приложения.

Это означает, что язык сделал шаг вперед в восприятии пространства и придумал собственное восприятие, действие и моделирование мира. Исследователи считают, что таким образом Космос-2 является основой для физического ИИ. Вы можете прочитать исследование здесь.

Что вы думаете о Microsoft Kosmos 2? Было бы хорошо, если бы у ИИ была физическая форма или нет? Дайте нам знать в комментариях ниже.

Создавайте контент с помощью Copilot, не беспокоясь о нарушении прав

Создавайте контент с помощью Copilot, не беспокоясь о нарушении правMicrosoft

Нарушение прав на контент, созданный искусственным интеллектом, вскоре может уйти в прошлое.В преддверии соглашения о новых услугах Microsoft объявляет об обязательстве Copilot по защите авторских ...

Читать далее
Microsoft будет менять только процессоры в следующих ноутбуках Surface

Microsoft будет менять только процессоры в следующих ноутбуках SurfaceMicrosoftSurface Pro

Новые версии ноутбуков Surface появятся в продаже в октябре.Surface Studio, Surface Go 2 и Surface Go 3 будут выпущены с обновленными процессорами в различных вариантах.Ожидается, что дизайн на все...

Читать далее
Microsoft Reader должен вернуться с функциями, улучшенными искусственным интеллектом

Microsoft Reader должен вернуться с функциями, улучшенными искусственным интеллектомMicrosoft

Microsoft Reader должен вернуться на мобильные устройства.Microsoft могла бы расширить приложение Reader возможностями искусственного интеллекта, включая функции преобразования текста в речь.В перв...

Читать далее