Kosmos-2 יכול להיות מהפכני עבור Embodiment AI.
- מחקר חדש שממומן על ידי מיקרוסופט מתעמק בפיזיות בינה מלאכותית.
- מודל השפה, Kosmos-2, הוכשר לתפוס מושגים מרחביים.
- זה גם מגיע עם ידע משלו על החלל.
מיקרוסופט משקיעה תקציב רב במימון מחקר בינה מלאכותית לאחרונה. אורקה 13B הוא קוד פתוח לציבור לאחר שצוות חוקרים שהורכב וממומן על ידי מיקרוסופט בנה אותו.
LongMem היא התקווה של מיקרוסופט לאורך הקשר בלתי מוגבל בדגמי AI. וזה גם תוצר של מחקר שממומן על ידי ענקית הטכנולוגיה מרדמונד.
פי-1, מודל שפה חדש לקידוד, מסוגל ללמוד ולפתח ידע בכוחות עצמו. מיקרוסופט מימנה את המחקר עבורו.
ונראה שה-Embodiment AI הוא המסע הבא בפיתוח AI. אבל אולי למיקרוסופט תהיה את התשובה עם מחקר נוסף על AI. הפעם זה בערך קוסמוס-2, מודל AI חדש שמניח את הבסיס ל-Embodiment AI.
ה-Kosmos-2 של מיקרוסופט הוא אב הטיפוס של Embodiment AI
אולי זו הפעם הראשונה שאתה שומע על Embodiment AI. ובכן, השם די מרמז בפני עצמו. אז מה זה Embodiment AI, אתם עשויים לשאול?
Embodiment AI הוא תחום של בינה מלאכותית המתמקד בפיתוח של סוכנים אינטליגנטיים בעלי גוף פיזי ויכולים לקיים אינטראקציה עם העולם בצורה משמעותית.
הרעיון מבוסס על הרעיון שלגוף הפיזי יש תפקיד משמעותי באופן שבו סוכן לומד ומקבל החלטות.
במילים אחרות, אם ל-AI יהיה גוף והוא היה זז, אז הוא יכול ללמוד מזה ולהגיב וליצור תשובות, כמו גם לקיים אינטראקציה בהתאם. ואם אתה חושב שאנחנו נכנסים לטריטוריה של מדע בדיוני, תחזיק מעמד. בינה מלאכותית תמיד הייתה אמורה להיות פיזית.
על פי המחקר, Kosmos-2 הוא מודל שפה המאפשר יכולות חדשות של תפיסת תיאורי אובייקט (למשל, תיבות תוחמות) וברקע טקסט לעולם החזותי. החוקרים המיוצגים מתייחסים לביטויים כקישורים ב-Markdown, כלומר, "טווח טקסט", כאשר תיאורי אובייקטים הם רצפים של אסימוני מיקום.
יחד עם קורפוסים מולטי-מודאליים, הם בנו נתונים בקנה מידה גדול של צמדי תמונה-טקסט מקורקעים (הנקראים GrIT) כדי לאמן את המודל. בנוסף לשילוב היכולות הקיימות של MLLMs ב-Kosmos-2, המודל משלב גם את יכולת ההארקה באפליקציות.
משמעות הדבר היא שהשפה עשתה צעדים קדימה לתפיסת מרחב ולהגיע עם תפיסה, פעולה ומודל עולמי משלה. החוקרים חושבים שככה Kosmos-2 הוא הבסיס לבינה מלאכותית פיזית. אתה יכול לקרוא את המחקר כאן.
מה אתה חושב על Microsoft Kosmos 2? האם זה יהיה טוב אם ל-AI יש צורה פיזית או לא? ספר לנו בקטע ההערות למטה.