מיקרוסופט השיקה כלי לזיהוי תמונות המנסה לתאר את תוכן התמונה. כלי הבינה המלאכותית הזה נמצא עדיין בשלב הפיתוח והוא לומד כל הזמן מתמונות שהועלו על ידי המשתמשים.
בכל הנוגע לדיוק, לפעמים התיאור מדויק למדי בעוד שלעתים CaptionBot מציע תיאורים שאין להם שום קשר למה שמתואר. ישנם גם מקרים שבהם האפליקציה אינה יכולה לספק תיאור כלל, בשל מצבה הקשה.
מיקרוסופט תכננה את CaptionBot ללמוד עם יותר ניסיון, תוך ציפייה שכיתוביה יהפכו מדויקים יותר עם הזמן. ככל שמשתמשים מעלים יותר תמונות, האפליקציה משתפרת כפי שמתאר את עצמה CaptionBot:
אני יכול להבין את התוכן של כל תמונה ואנסה לתאר אותה כמו גם כל אדם. אני עדיין לומד אז אני אחזיק בתצלום שלך אך ללא מידע אישי.
CaptionBot משתמש בשלוש טכנולוגיות כדי לתאר את מה שמתואר בתמונה: ראיית המחשבים, הרגש ותמונת הבינג של מיקרוסופט. ממשק ה- API של חזון המחשב מחלץ מידע עשיר מתמונות כדי לקטלג ולעבד נתונים חזותיים לצד זיהוי וחילוץ טקסט מתמונה. ה ממשק API לרגש, כשמו כן הוא, לנתח פנים כדי לזהות מגוון תחושות, החל מכעס, בוז, גועל, פחד, אושר, ניטרליות, עצב והפתעה. תמונה של בינג מחפש באינטרנט תמונות.
בדקנו את CaptionBot והתוצאות היו מדויקות ב -50% מהמקרים. לדוגמה, העלינו שתי תמונות: אחת מתארת עכבר גיימינג, והשנייה ערימת כרטיס. בשני המקרים הכלי הציע שמדובר בטלפון סלולרי. מצד שני, CaptionBot זיהה באופן מדויק בני אדם ופנים.
ככל הנראה, ל- CaptionBot יש אובססיה לטלפונים סלולריים. משתמש אחד בטוויטר דיווח כי האפליקציה חשבה שמישל אובמה היא טלפון סלולרי. לקבלת כיתוב נוסף של כיתוב בוט, בדוק דף טוויטר זה.
אתה יכול גם לבדוק את CaptionBot פה. נסה זאת: או שתעזור לכלי להשתפר או שתצחוק טוב!
סיפורים קשורים שאתה צריך לבדוק:
- בניית 2016: מיקרוסופט מתכננת הדגמה של בוטים חכמים של AI
- Cortana זוכה לשיפורים רבים ב- Windows 10: הנה הם
- מיקרוסופט מאפשרת לך לחפש באינטרנט באמצעות בוטים של Skype
- הרובוטים הם העתיד ומיקרוסופט נמצאת על המשך [Build 2016]