
Microsoft ได้เปิดตัวเครื่องมือการจดจำภาพที่พยายามอธิบายเนื้อหาของรูปภาพ เครื่องมือปัญญาประดิษฐ์นี้ยังอยู่ในขั้นตอนการพัฒนาและเรียนรู้อย่างต่อเนื่องจากรูปภาพที่ผู้ใช้อัปโหลด
ในแง่ของความแม่นยำ บางครั้งคำอธิบายก็ค่อนข้างแม่นยำ ในขณะที่บางครั้ง CaptionBot เสนอคำอธิบายที่ไม่เกี่ยวข้องกับสิ่งที่กำลังแสดง นอกจากนี้ยังมีบางกรณีที่แอปไม่สามารถให้คำอธิบายได้เลย เนื่องจากมีสถานะคร่าวๆ
Microsoft ออกแบบ CaptionBot เพื่อเรียนรู้ด้วยประสบการณ์ที่มากขึ้น โดยคาดหวังว่าคำบรรยายจะแม่นยำยิ่งขึ้นเมื่อเวลาผ่านไป ยิ่งผู้ใช้อัปโหลดรูปภาพมากเท่าไร แอปก็จะยิ่งดีขึ้นตามคำอธิบายของ CaptionBot:
ฉันเข้าใจเนื้อหาของภาพใด ๆ และฉันจะพยายามอธิบายมันเช่นเดียวกับมนุษย์ทุกคน ฉันยังคงเรียนรู้อยู่ ดังนั้นฉันจะเก็บรูปภาพของคุณไว้แต่ไม่มีข้อมูลส่วนบุคคล
CaptionBot ใช้เทคโนโลยีสามอย่างเพื่ออธิบายสิ่งที่ปรากฎในภาพ: Computer Vision, Emotion และ Bing Image ของ Microsoft คอมพิวเตอร์วิชั่น API ดึงข้อมูลจำนวนมากจากภาพเพื่อจัดหมวดหมู่และประมวลผลข้อมูลภาพควบคู่ไปกับการระบุและแยกข้อความออกจากภาพ ดิ อารมณ์ APIตามชื่อของมัน วิเคราะห์ใบหน้าเพื่อตรวจจับความรู้สึกต่างๆ ตั้งแต่ความโกรธ การดูถูก รังเกียจ ความกลัว ความสุข ความเป็นกลาง ความเศร้าและความประหลาดใจ
Bing Image ค้นหาเว็บสำหรับรูปภาพเราทดสอบ CaptionBot และผลลัพธ์นั้นแม่นยำใน 50% ของกรณีทั้งหมด ตัวอย่างเช่น เราอัปโหลดภาพสองภาพ ภาพแรกแสดงเมาส์สำหรับเล่นเกม อีกภาพหนึ่งเป็นกองการ์ด ในทั้งสองกรณี เครื่องมือแนะนำว่าเป็นโทรศัพท์มือถือ ในทางกลับกัน CaptionBot ตรวจจับคนและใบหน้าได้อย่างแม่นยำ
เห็นได้ชัดว่า CaptionBot มีความหลงใหลในโทรศัพท์มือถือ ผู้ใช้ Twitter รายหนึ่งรายงานว่าแอปคิดว่า Michelle Obama เป็นโทรศัพท์มือถือ สำหรับคำบรรยายภาพตลกๆ ของ CaptionBot โปรดดูที่ ทวิตเตอร์เพจนี้.
คุณยังสามารถทดสอบ CaptionBot ที่นี่. ลองใช้เลย: คุณจะช่วยปรับปรุงเครื่องมือหรือคุณจะหัวเราะเยาะ!
เรื่องราวที่เกี่ยวข้องที่คุณต้องตรวจสอบ:
- Build 2016: Microsoft วางแผนที่จะสาธิตบอท AI อัจฉริยะ
- Cortana ได้รับการปรับปรุงมากมายใน Windows 10: อยู่นี่แล้ว
- Microsoft ให้คุณค้นหาเว็บด้วยบ็อต Skype
- บอทคืออนาคต และ Microsoft ก็พร้อมแล้ว [บิลด์ 2016]