Microsoft Kosmos-2: як штучний інтелект може взаємодіяти зі світом

Космос-2 може стати революційним для Embodiment AI.

  • Нове дослідження, фінансоване Microsoft, присвячене фізичності ШІ.
  • Мовну модель Космос-2 навчили сприймати просторові поняття.
  • Він також має власні знання про космос.
Майкрософт Космос 2

Останнім часом корпорація Майкрософт витрачає значні кошти на дослідження ШІ. Orca 13B є відкритим кодом для громадськості після того, як команда дослідників, зібрана та фінансована Microsoft, створила його.

LongMem Microsoft сподівається на необмежену довжину контексту в моделях ШІ. І це також результат дослідження, фінансованого технічним гігантом із Редмонда.

Фі-1, нова мовна модель для кодування, здатна навчатися та розвивати знання самостійно. Microsoft профінансувала дослідження для цього.

І, здається, Embodiment AI – наступний квест у розробці AI. Але Майкрософт може знайти відповідь ще одним дослідженням штучного інтелекту. Цього разу мова йде про Космос-2, нова модель AI, яка закладає основу для Embodiment AI.

Kosmos-2 від Microsoft є прототипом Embodiment AI

Можливо, ви вперше чуєте про Embodiment AI. Що ж, назва досить натякає сама по собі. Ви можете запитати, що таке Втілення ШІ?

Втілення ШІ — це галузь штучного інтелекту, яка зосереджена на розробці інтелектуальних агентів, які мають фізичне тіло та можуть взаємодіяти зі світом змістовним чином.

Концепція базується на ідеї, що фізичне тіло відіграє значну роль у тому, як агент навчається та приймає рішення.Майкрософт Космос 2

Іншими словами, якби штучний інтелект мав тіло і рухався, він міг би вчитися на цьому, реагувати та формувати відповіді, а також відповідним чином взаємодіяти. І якщо ви думаєте, що ми вступаємо на територію наукової фантастики, тримайтеся. ШІ завжди мав стати фізичним.

Згідно з дослідженням, Космос-2 — це мовна модель, яка надає нові можливості сприйняття описів об’єктів (наприклад, обмежувальних рамок) і прив’язування тексту до візуального світу. Представлені дослідники посилаються на вирази як на посилання в Markdown, тобто «текстовий діапазон», де опис об’єктів є послідовністю токенів розташування.

Разом із мультимодальними корпусами вони побудували великомасштабні дані обґрунтованих пар зображення-текст (так звані GrIT) для навчання моделі. На додаток до інтеграції існуючих можливостей MLLM в Космос-2, модель також інтегрує можливість заземлення в програми.

Це означає, що мова зробила крок вперед у сприйнятті простору та створила власне сприйняття, дії та моделювання світу. Дослідники вважають, що Космос-2 є основою для фізичного ШІ. Ви можете прочитати дослідження тут.

Що ви думаєте про Microsoft Kosmos 2? Було б добре, якби ШІ мав фізичну форму чи ні? Повідомте нам у розділі коментарів нижче.

Microsoft представляє новий телефон - і це не те, що ви очікували

Microsoft представляє новий телефон - і це не те, що ви очікувалиMicrosoftNokia

Microsoft представила новий телефон, і це не довгоочікуваний Поверхневий телефон. Технологічний гігант випустив Nokia 216 - телефон початкового рівня, який фокусується на трьох елементах: програмах...

Читати далі
Microsoft пропонує програму Office Insider для користувачів iPhone та iPad

Microsoft пропонує програму Office Insider для користувачів iPhone та iPadMicrosoftінсайдер Microsoft Office

Microsoft увійшов у звичку розміщувати бета-програми для більшості своїх важливих служб. Це, безсумнівно, добре, оскільки це дає людям можливість випробувати майбутні функції та реалізації до того,...

Читати далі
Корпорація Майкрософт побила рекорд більшості бюлетенів з питань безпеки, випущених у 2016 році

Корпорація Майкрософт побила рекорд більшості бюлетенів з питань безпеки, випущених у 2016 роціMicrosoftпомилки оновлення Windows

Який рік для Microsoft! Цього року компанія досягла різноманітних досягнень, включаючи вихід у нові технологічні галузі, залучення більшої кількості користувачів до своїх послуг, тощо Але Редмонд т...

Читати далі