قد يكون Kosmos-2 ثوريًا بالنسبة لـ Embodiment AI.
- بحث جديد ممول من Microsoft يتعمق في بدنية الذكاء الاصطناعي.
- تم تدريب نموذج اللغة ، Kosmos-2 ، على إدراك المفاهيم المكانية.
- كما أنه يأتي بمعرفته الخاصة بالفضاء.
خصصت Microsoft الكثير من الميزانية لتمويل أبحاث الذكاء الاصطناعي مؤخرًا. Orca 13B مفتوح المصدر للجمهور بعد أن قام فريق من الباحثين بتجميعه وتمويله من قبل Microsoft ببنائه.
LongMem هو أمل Microsoft في طول سياق غير محدود في نماذج الذكاء الاصطناعي. وهو أيضًا نتاج بحث تموله شركة التكنولوجيا العملاقة في ريدموند.
فاي -1، نموذج لغة جديد للترميز ، قادر على التعلم وتطوير المعرفة من تلقاء نفسه. قامت Microsoft بتمويل البحث من أجلها.
ويبدو أن تجسيد الذكاء الاصطناعي هو البحث التالي في تطوير الذكاء الاصطناعي. لكن قد يكون لدى Microsoft الإجابة فقط من خلال بحث آخر حول الذكاء الاصطناعي. هذه المرة حان الوقت كوزموس -2، نموذج جديد للذكاء الاصطناعي يضع الأساس لـ Embodiment AI.
يعد Kosmos-2 من Microsoft هو النموذج الأولي لـ Embodiment AI
ربما تكون هذه هي المرة الأولى التي تسمع فيها عن Embodiment AI. حسنًا ، الاسم موحٍ جدًا في حد ذاته. إذن ما هو تجسيد الذكاء الاصطناعي ، قد تسأل؟
التجسيد الذكاء الاصطناعي هو مجال للذكاء الاصطناعي يركز على تطوير عوامل ذكية لها جسم مادي ويمكنها التفاعل مع العالم بطريقة هادفة.
يعتمد المفهوم على فكرة أن الجسم المادي يلعب دورًا مهمًا في كيفية تعلم الوكيل واتخاذ القرارات.
بعبارة أخرى ، إذا كان للذكاء الاصطناعي جسم وسيتحرك ، فيمكنه التعلم من ذلك والاستجابة وتشكيل الإجابات ، وكذلك التفاعل وفقًا لذلك. وإذا كنت تعتقد أننا ندخل منطقة الخيال العلمي ، فتمسك بموقفك. كان من المفترض دائمًا أن يصبح الذكاء الاصطناعي فيزيائيًا.
وفقًا للبحث ، يعد Kosmos-2 نموذجًا لغويًا يتيح إمكانات جديدة لإدراك أوصاف الكائنات (على سبيل المثال ، المربعات المحيطة) وتأريض النص للعالم المرئي. قام الباحثون بتمثيل تعبيرات الإحالة على أنها روابط في Markdown ، أي "امتداد النص" ، حيث تكون أوصاف الكائن عبارة عن تسلسلات من الرموز المميزة للموقع.
جنبًا إلى جنب مع المجموعات متعددة الوسائط ، قاموا ببناء بيانات واسعة النطاق لأزواج نصوص الصورة المؤرضة (تسمى GrIT) لتدريب النموذج. بالإضافة إلى دمج القدرات الحالية لـ MLLMs في Kosmos-2 ، يدمج النموذج أيضًا قدرة التأريض في التطبيقات.
هذا يعني أن اللغة قد اتخذت خطوات للأمام في إدراك الفضاء والخروج بإدراكها وعملها ونمذجة العالم. يعتقد الباحثون بهذه الطريقة أن Kosmos-2 هي الأساس للذكاء الاصطناعي المادي. يمكنك قراءة البحث هنا.
ما رأيك في Microsoft Kosmos 2؟ هل سيكون من الجيد أن يكون للذكاء الاصطناعي شكل مادي أم لا؟ واسمحوا لنا أن نعرف في قسم التعليقات أدناه.