InstructDiffusion은 의미론적 의미를 이해할 수 있으며 이를 사용하여 이미지를 편집합니다.
- InstructDiffusion은 과거 명령을 사용하여 의미론적 의미를 이해하는 능력을 얻을 수 있는 AI입니다.
- 이 모델은 또한 인상적인 일반화 기능도 갖추고 있습니다.
- 시각적 단서에 대해 학습하면 모델은 이를 크게 확장하여 자체 학습을 더욱 강화합니다.
마이크로소프트의 최신 AI 모델, 확산 지시, 귀하의 지침에 따라 귀하의 이미지 또는 귀하가 업로드할 수 있는 모든 이미지를 근본적으로 변형시킵니다. Microsoft Research Asia가 개발한 이 모델은 AI와 인간 지침을 결합하여 다양한 시각적 작업을 생성하고 완료하는 인터페이스입니다.
즉, 편집, 변경 또는 변형하려는 이미지를 선택하면 InstructDiffusion이 컴퓨터 비전을 구현하여 입력에 따라 이미지를 변경합니다.
마이크로소프트 출시 종이 며칠 전 모델에 대해 InstructDiffusion에 이미 데모 놀이터, 모델을 직접 시험해 볼 수 있습니다.
IntructDiffusion의 주요 혁신은 모델에 이미지에 대한 사전 지식이 필요하지 않고 대신 확산 프로세스를 사용하여 픽셀을 조작한다는 것입니다. 이 모델은 분할, 키포인트 감지, 복원과 같은 유용한 기능을 많이 제공할 수 있습니다. 실제로 InstructDiffusion은 지침을 사용하여 이미지를 변경합니다.
한 예에서 Microsoft Research Asia는 단순히 모델에 지시하여 사진의 워터마크를 제거할 수 있었습니다.
Microsoft의 InstructDiffusion은 지침 뒤에 숨은 의미를 구별할 수 있습니다.
InstructDiffusion은 다른 많은 것과 마찬가지로 마이크로소프트 AI 모델, 과제 해결에 있어 혁신적인 행동을 할 수 있습니다. Microsoft Research Asia는 InstructDiffusion이 이해 작업과 생성 작업을 구현한다고 주장합니다.
모델은 세분화 및 키포인트 감지와 같은 이해 작업을 사용하여 편집하려는 영역과 픽셀을 찾습니다.
예를 들어, 모델은 분할을 사용하여 다음 명령의 영역을 성공적으로 찾습니다. 이미지 오른쪽에 있는 사람을 빨간색으로 칠합니다. 키포인트 감지의 경우 다음과 같은 지침이 있습니다. 노란색을 사용하여 이미지 맨 왼쪽에 있는 남자의 무릎을 둘러싸세요.
생성 작업은 편집 작업과 복원 작업으로 구성됩니다. InstructDiffusion이 이미지를 편집할 뿐만 아니라 모델도 지침에 따라 이미지에 대한 새 요소를 생성합니다.
Microsoft InstructDiffusion의 가장 유망한 기능은 받은 모든 지침을 성공적으로 일반화하여 그 뒤에 있는 의미에 대한 응집력 있고 깊은 이해를 형성하는 능력입니다. 즉, 모델은 사용자가 제공한 지침을 기억하고 해당 지침을 사용하여 더욱 효과적으로 학습할 수 있습니다.
그러나 모델은 또한 지침 뒤에 숨겨진 의미를 구별하는 방법을 학습하여 보이지 않는 작업을 해결하고 요소를 생성하는 새로운 방법을 찾아냅니다. 의미론적 의미를 이해하는 이러한 능력은 InstructDifussion을 다른 유사한 모델보다 한 단계 더 발전시킵니다. 즉, InstructDifussion보다 성능이 뛰어납니다.
그러나 InstructDiffusion은 한 단계 더 발전했습니다. AGI에 도달하기 위해: 모든 명령 뒤에 숨은 의미론적 의미를 깊이 이해하고 컴퓨터 비전을 성공적으로 일반화할 수 있는 모델은 AI 개발을 크게 발전시킬 것입니다.
Microsoft Research Asia를 사용하면 다음과 같은 방법으로 시험해 볼 수 있습니다. 데모 놀이터, 하지만 당신도 할 수 있습니다 해당 코드를 사용 자신만의 AI 모델을 훈련시키세요.
이 모델에 대한 귀하의 의견은 무엇입니까? 시도해 보시겠어요?