Microsoft Kosmos-2: як штучний інтелект може взаємодіяти зі світом

Космос-2 може стати революційним для Embodiment AI.

  • Нове дослідження, фінансоване Microsoft, присвячене фізичності ШІ.
  • Мовну модель Космос-2 навчили сприймати просторові поняття.
  • Він також має власні знання про космос.
Майкрософт Космос 2

Останнім часом корпорація Майкрософт витрачає значні кошти на дослідження ШІ. Orca 13B є відкритим кодом для громадськості після того, як команда дослідників, зібрана та фінансована Microsoft, створила його.

LongMem Microsoft сподівається на необмежену довжину контексту в моделях ШІ. І це також результат дослідження, фінансованого технічним гігантом із Редмонда.

Фі-1, нова мовна модель для кодування, здатна навчатися та розвивати знання самостійно. Microsoft профінансувала дослідження для цього.

І, здається, Embodiment AI – наступний квест у розробці AI. Але Майкрософт може знайти відповідь ще одним дослідженням штучного інтелекту. Цього разу мова йде про Космос-2, нова модель AI, яка закладає основу для Embodiment AI.

Kosmos-2 від Microsoft є прототипом Embodiment AI

Можливо, ви вперше чуєте про Embodiment AI. Що ж, назва досить натякає сама по собі. Ви можете запитати, що таке Втілення ШІ?

Втілення ШІ — це галузь штучного інтелекту, яка зосереджена на розробці інтелектуальних агентів, які мають фізичне тіло та можуть взаємодіяти зі світом змістовним чином.

Концепція базується на ідеї, що фізичне тіло відіграє значну роль у тому, як агент навчається та приймає рішення.Майкрософт Космос 2

Іншими словами, якби штучний інтелект мав тіло і рухався, він міг би вчитися на цьому, реагувати та формувати відповіді, а також відповідним чином взаємодіяти. І якщо ви думаєте, що ми вступаємо на територію наукової фантастики, тримайтеся. ШІ завжди мав стати фізичним.

Згідно з дослідженням, Космос-2 — це мовна модель, яка надає нові можливості сприйняття описів об’єктів (наприклад, обмежувальних рамок) і прив’язування тексту до візуального світу. Представлені дослідники посилаються на вирази як на посилання в Markdown, тобто «текстовий діапазон», де опис об’єктів є послідовністю токенів розташування.

Разом із мультимодальними корпусами вони побудували великомасштабні дані обґрунтованих пар зображення-текст (так звані GrIT) для навчання моделі. На додаток до інтеграції існуючих можливостей MLLM в Космос-2, модель також інтегрує можливість заземлення в програми.

Це означає, що мова зробила крок вперед у сприйнятті простору та створила власне сприйняття, дії та моделювання світу. Дослідники вважають, що Космос-2 є основою для фізичного ШІ. Ви можете прочитати дослідження тут.

Що ви думаєте про Microsoft Kosmos 2? Було б добре, якби ШІ мав фізичну форму чи ні? Повідомте нам у розділі коментарів нижче.

Додаток Microsoft Band для синхронізації даних із планшетами Windows та Apple Mac

Додаток Microsoft Band для синхронізації даних із планшетами Windows та Apple MacWindows планшетиMicrosoft

Нещодавно корпорація Майкрософт представила свій перший набіг на ринку носіїв - фітнес-трекер, названий просто "Microsoft Band". І хоча він орієнтований на власників смартфонів, ми сподіваємось, що...

Читати далі
Щомісяця Skype має понад 300 мільйонів активних користувачів, зазначає Microsoft

Щомісяця Skype має понад 300 мільйонів активних користувачів, зазначає MicrosoftMicrosoftSkypeЗбірка 2016 року

Skype завжди був дуже популярною програмою VoIP, і останні цифри це підтверджують.Разом із Skype build 2016, програмний гігант показав, що він охопив 300 мільйонів користувачів.Ці цифри лише збільш...

Читати далі
Нова цифрова дошка Microsoft покращує ваші презентації

Нова цифрова дошка Microsoft покращує ваші презентаціїТакMicrosoft

Computex - одна з найбільших щорічних виставок, де компанії демонструють своє найновіше обладнання в червні. Microsoft щойно продемонструвала абсолютно нову різновид цифрових дошок від сторонніх ви...

Читати далі