Kosmos-2 შეიძლება იყოს რევოლუციური Embodiment AI-სთვის.
- Microsoft-ის მიერ დაფინანსებული ახალი კვლევა სწავლობს ხელოვნური ინტელექტის ფიზიკურობას.
- ენის მოდელი, Kosmos-2, გაწვრთნილი იყო სივრცითი ცნებების აღქმაზე.
- მას ასევე გააჩნია საკუთარი ცოდნა სივრცის შესახებ.
Microsoft ბოლო დროს დიდ ბიუჯეტს ხარჯავს ხელოვნური ინტელექტის კვლევის დასაფინანსებლად. ორკა 13ბ ღია წყაროა საზოგადოებისთვის მას შემდეგ, რაც Microsoft-ის მიერ შეკრებილი და დაფინანსებული მკვლევართა გუნდი ააშენა.
LongMem არის Microsoft-ის იმედი შეუზღუდავი კონტექსტის სიგრძის AI მოდელებში. და ის ასევე არის რედმონდში დაფუძნებული ტექნიკური გიგანტის მიერ დაფინანსებული კვლევის პროდუქტი.
ფი-1, კოდირების ახალ ენობრივ მოდელს, შეუძლია დამოუკიდებლად ისწავლოს და განავითაროს ცოდნა. ამისთვის კვლევა მაიკროსოფტმა დააფინანსა.
და, როგორც ჩანს, Embodiment AI არის შემდეგი ქვესტი ხელოვნური ინტელექტის განვითარებაში. მაგრამ მაიკროსოფტს შესაძლოა ჰქონდეს პასუხი ხელოვნური ინტელექტის შესახებ სხვა კვლევით. ამჯერად საუბარია კოსმოსი-2, ახალი AI მოდელი, რომელიც საფუძველს უყრის Embodiment AI-ს.
Microsoft-ის Kosmos-2 არის Embodiment AI პროტოტიპი
შესაძლოა, პირველად გესმით Embodiment AI-ს შესახებ. ისე, სახელი თავისთავად საკმაოდ დამაფიქრებელია. რა არის Embodiment AI, შეიძლება იკითხოთ?
Embodiment AI არის ხელოვნური ინტელექტის სფერო, რომელიც ფოკუსირებულია ინტელექტუალური აგენტების განვითარებაზე, რომლებსაც აქვთ ფიზიკური სხეული და შეუძლიათ სამყაროსთან მნიშვნელოვანი ურთიერთქმედება.
კონცეფცია ემყარება იმ აზრს, რომ ფიზიკური სხეული მნიშვნელოვან როლს ასრულებს აგენტის სწავლაში და გადაწყვეტილების მიღებაში.
სხვა სიტყვებით რომ ვთქვათ, თუ ხელოვნურ ინტელექტს ექნებოდა სხეული და მოძრაობდა, მაშინ მას შეეძლო ამისგან ისწავლოს და უპასუხოს და შექმნას პასუხები, ასევე ურთიერთქმედება შესაბამისად. და თუ ფიქრობთ, რომ ჩვენ შევდივართ სამეცნიერო ფანტასტიკის ტერიტორიაზე, შეინარჩუნეთ თქვენი პოზიცია. ხელოვნური ინტელექტი ყოველთვის უნდა გამხდარიყო ფიზიკური.
კვლევის მიხედვით, Kosmos-2 არის ენობრივი მოდელი, რომელიც საშუალებას იძლევა ახალი შესაძლებლობების აღქმა ობიექტების აღწერილობების (მაგ., შეზღუდვის უჯრების) და ტექსტის დასაბუთების ვიზუალურ სამყაროში. მკვლევარებმა წარმოადგინეს გამონათქვამები, როგორც ბმულები Markdown-ში, ანუ „ტექსტის დიაპაზონი“, სადაც ობიექტების აღწერილობა არის მდებარეობის ნიშნების თანმიმდევრობა.
მულტიმოდალურ კორპუსებთან ერთად, მათ შექმნეს დამიწებული გამოსახულება-ტექსტის წყვილების (ე.წ. GrIT) ფართომასშტაბიანი მონაცემები მოდელის მოსამზადებლად. გარდა MLLM-ების არსებული შესაძლებლობების ინტეგრაციისა Kosmos-2-ში, მოდელი ასევე აერთიანებს დამიწების შესაძლებლობას აპლიკაციებში.
ეს ნიშნავს, რომ ენამ გადადგა ნაბიჯები სივრცის აღქმისა და საკუთარი აღქმის, მოქმედებისა და სამყაროს მოდელირებისკენ. მკვლევარები ფიქრობენ, რომ ამ გზით Kosmos-2 არის საფუძველი ფიზიკური AI-სთვის. შეგიძლიათ წაიკითხოთ კვლევა აქ.
რას ფიქრობთ Microsoft Kosmos 2-ზე? კარგი იქნება AI-ს ფიზიკური ფორმა ჰქონდეს თუ არა? შეგვატყობინეთ ქვემოთ მოცემულ კომენტარების განყოფილებაში.