Microsoft는 사진의 내용을 설명하는 이미지 인식 도구를 출시했습니다. 이 인공 지능 도구는 아직 개발 단계에 있으며 사용자가 업로드 한 사진에서 지속적으로 학습하고 있습니다.
정확성에 관한 한 설명이 상당히 정확할 때도 있지만 CaptionBot은 묘사되는 내용과 관련이없는 설명을 제공하기도합니다. 또한 앱이 가장자리가 거친 상태로 인해 설명을 전혀 제공 할 수없는 경우도 있습니다.
Microsoft는 캡션이 시간이 지남에 따라 더 정확해질 것이라는 기대와 함께 더 많은 경험으로 학습 할 수 있도록 CaptionBot을 설계했습니다. CaptionBot이 설명하는 것처럼 사용자가 더 많은 사진을 업로드할수록 앱이 더 좋아집니다.
나는 어떤 이미지의 내용도 이해할 수 있고 어떤 사람도 묘사하려고 노력할 것입니다. 아직 배우는 중이므로 개인 정보는 제외하고 사진을 보관하겠습니다.
CaptionBot은 Microsoft의 컴퓨터 비전, 감정 및 Bing 이미지라는 세 가지 기술을 사용하여 사진에 묘사되는 내용을 설명합니다. Computer Vision API 이미지에서 풍부한 정보를 추출하여 이미지에서 텍스트를 식별 및 추출하는 동시에 시각적 데이터를 분류 및 처리합니다. 그만큼 감정 API, 이름에서 알 수 있듯이 얼굴을 분석하여 분노, 경멸, 혐오, 두려움, 행복, 중립성, 슬픔 및 놀라움 등 다양한 감정을 감지합니다. Bing 이미지 웹에서 이미지를 검색합니다.
CaptionBot을 테스트 한 결과 50 %의 경우 정확했습니다. 예를 들어, 우리는 두 장의 사진을 업로드했습니다. 하나는 게임용 마우스, 다른 하나는 카드 더미입니다. 두 경우 모두이 도구는 휴대 전화라고 제안했습니다. 반면 CaptionBot은 사람과 얼굴을 정확하게 감지했습니다.
분명히 CaptionBot은 휴대폰에 집착합니다. 한 트위터 사용자는 앱이 Michelle Obama가 휴대폰이라고 생각했다고보고했습니다. 더 많은 CaptionBot 재미있는 캡션을 확인하려면 이 트위터 페이지.
CaptionBot을 테스트 할 수도 있습니다. 여기. 시도해보세요. 도구 개선을 돕거나 웃을 수 있습니다.
확인해야 할 관련 이야기 :
- 빌드 2016: 스마트 AI 봇 데모를 계획하는 Microsoft
- Cortana는 Windows 10에서 많은 개선 사항을 얻었습니다.
- Microsoft에서는 Skype 봇으로 웹을 검색 할 수 있습니다.
- 봇은 미래이며 Microsoft는 온보드 [Build 2016]