Космос-2 може стати революційним для Embodiment AI.
- Нове дослідження, фінансоване Microsoft, присвячене фізичності ШІ.
- Мовну модель Космос-2 навчили сприймати просторові поняття.
- Він також має власні знання про космос.
Останнім часом корпорація Майкрософт витрачає значні кошти на дослідження ШІ. Orca 13B є відкритим кодом для громадськості після того, як команда дослідників, зібрана та фінансована Microsoft, створила його.
LongMem Microsoft сподівається на необмежену довжину контексту в моделях ШІ. І це також результат дослідження, фінансованого технічним гігантом із Редмонда.
Фі-1, нова мовна модель для кодування, здатна навчатися та розвивати знання самостійно. Microsoft профінансувала дослідження для цього.
І, здається, Embodiment AI – наступний квест у розробці AI. Але Майкрософт може знайти відповідь ще одним дослідженням штучного інтелекту. Цього разу мова йде про Космос-2, нова модель AI, яка закладає основу для Embodiment AI.
Kosmos-2 від Microsoft є прототипом Embodiment AI
Можливо, ви вперше чуєте про Embodiment AI. Що ж, назва досить натякає сама по собі. Ви можете запитати, що таке Втілення ШІ?
Втілення ШІ — це галузь штучного інтелекту, яка зосереджена на розробці інтелектуальних агентів, які мають фізичне тіло та можуть взаємодіяти зі світом змістовним чином.
Концепція базується на ідеї, що фізичне тіло відіграє значну роль у тому, як агент навчається та приймає рішення.
Іншими словами, якби штучний інтелект мав тіло і рухався, він міг би вчитися на цьому, реагувати та формувати відповіді, а також відповідним чином взаємодіяти. І якщо ви думаєте, що ми вступаємо на територію наукової фантастики, тримайтеся. ШІ завжди мав стати фізичним.
Згідно з дослідженням, Космос-2 — це мовна модель, яка надає нові можливості сприйняття описів об’єктів (наприклад, обмежувальних рамок) і прив’язування тексту до візуального світу. Представлені дослідники посилаються на вирази як на посилання в Markdown, тобто «текстовий діапазон», де опис об’єктів є послідовністю токенів розташування.
Разом із мультимодальними корпусами вони побудували великомасштабні дані обґрунтованих пар зображення-текст (так звані GrIT) для навчання моделі. На додаток до інтеграції існуючих можливостей MLLM в Космос-2, модель також інтегрує можливість заземлення в програми.
Це означає, що мова зробила крок вперед у сприйнятті простору та створила власне сприйняття, дії та моделювання світу. Дослідники вважають, що Космос-2 є основою для фізичного ШІ. Ви можете прочитати дослідження тут.
Що ви думаєте про Microsoft Kosmos 2? Було б добре, якби ШІ мав фізичну форму чи ні? Повідомте нам у розділі коментарів нижче.