InstructDiffusion від Microsoft відредагує ваші зображення відповідно до ваших інструкцій

InstructDiffusion здатний розуміти семантичні значення та використовуватиме їх для редагування ваших зображень.

  • InstructDiffusion — це штучний інтелект, здатний використовувати минулі інструкції, щоб отримати здатність розуміти семантичні значення.
  • Модель також має вражаючі можливості узагальнення.
  • Коли модель дізнається про візуальну підказку, вона значно розширить її, щоб навчатися ще далі.
microsoft instructdiffusion

Остання модель ШІ Microsoft, Instruct Diffusion, радикально змінить ваші зображення або будь-які зображення, які ви можете завантажити відповідно до ваших інструкцій. Модель, розроблена компанією Microsoft Research Asia, являє собою інтерфейс, який об’єднує команди штучного інтелекту та людини для створення та виконання різноманітних візуальних завдань.

Іншими словами, ви обираєте зображення, яке хочете відредагувати, змінити чи трансформувати, а InstructDiffusion запровадить своє комп’ютерне бачення, щоб змінити зображення на основі ваших даних.

Microsoft випустила папір для моделі кілька днів тому, і InstructDiffusion вже має демонстраційний майданчик, де ви можете спробувати модель на собі.

Ключове нововведення в IntructDiffusion полягає в тому, що моделі не потрібні попередні знання про зображення, натомість вона використовує процес дифузії для керування пікселями. Модель має багато корисних функцій, таких як сегментація, визначення ключових точок і відновлення. Практично InstructDiffusion використовуватиме ваші інструкції, щоб змінити зображення.

В одному прикладі Microsoft Research Asia змогла видалити водяний знак на фотографії, просто давши вказівку моделі зробити це.

InstructDiffusion від Microsoft здатний розрізняти значення ваших інструкцій

InstructDiffusion, як і багато інших Моделі Microsoft AI, здатний до інноваційної поведінки, коли справа доходить до вирішення завдань. Microsoft Research Asia стверджує, що InstructDiffusion реалізує завдання розуміння та генеративні завдання.

Модель використовуватиме завдання розуміння, такі як сегментація та визначення ключових точок, щоб знайти область і пікселі, які ви хочете редагувати.

Наприклад, модель використовує сегментацію, щоб успішно знайти область вашої наступної інструкції: пофарбуйте людину праворуч від зображення в червоний колір. Для виявлення ключових точок інструкція буде такою: жовтим кольором обведіть коліно людини в лівій частині зображення.

Генеративні завдання складаються з редагуючих і відновлювальних. InstructDiffusion не лише відредагує ваше зображення, але модель також створить нові елементи для зображення на основі ваших інструкцій.microsoft instructdiffusion

Найбільш багатообіцяючою функцією Microsoft InstructDiffusion є її здатність успішно узагальнювати всі отримані інструкції, щоб сформувати цілісне та глибоке розуміння значення, що стоїть за ними. Іншими словами, модель запам’ятає вказівки, які ви їй дали, і успішно використає їх для подальшого навчання.

Приклад того, як InstructDiffusion працює над заданою інструкцією.

Але модель також навчиться розрізняти значення, що стоять за вашими інструкціями, що веде до вирішення невидимих ​​завдань і винаходить нові способи створення елементів. Ця здатність розуміти семантичні значення ставить InstructDifussion на крок далі, ніж інші подібні моделі: він перевершує їх.

Однак InstructDiffusion також є кроком далі до досягнення AGI: Завдяки глибокому розумінню семантичного значення кожної інструкції та здатності успішно узагальнювати комп’ютерне бачення модель значно просуне розвиток ШІ.

Microsoft Research Asia дозволяє спробувати це в a демонстраційний майданчик, але ви також можете використовувати його код навчити власну модель ШІ.

Що ви думаєте про цю модель? Ви спробуєте?

Люди погоджуються, що консолі Xbox дуже далекі від провалу

Люди погоджуються, що консолі Xbox дуже далекі від провалуMicrosoftXbox

Здається, люди люблять консолі Xbox, і це добре.Xbox дуже популярний у США.Останні консолі Xbox продано понад 21 мільйон одиниць.Людям подобається Xbox, і в довгостроковій перспективі це змінить пр...

Читати далі
Microsoft скоротила творчий режим у Bing Chat, і це погано

Microsoft скоротила творчий режим у Bing Chat, і це поганоMicrosoftБінг

Штучний інтелект з відкритим кодом може бути набагато креативнішим.Користувачі погоджуються, що Bing Chat став занадто обмеженим.Однак Bing пов’язаний із Microsoft, а це означає, що він дотримуєтьс...

Читати далі
Ось як виглядає нова інформаційна панель Xbox

Ось як виглядає нова інформаційна панель XboxMicrosoftXbox

Нова інформаційна панель Xbox буде випущена пізніше цього року.Нова інформаційна панель може з’явитися у вересні або раніше.Виглядає чисто і просторо.Наразі це доступно для ознайомлення в програмі ...

Читати далі