InstructDiffusion способен понимать семантические значения и использовать их для редактирования ваших изображений.
- InstructDiffusion — это ИИ, способный использовать прошлые инструкции для понимания семантического значения.
- Модель также обладает впечатляющими возможностями обобщения.
- Как только она узнает о визуальном сигнале, модель значительно расширит его, чтобы тренироваться еще больше.
Новейшая модель искусственного интеллекта Microsoft, Поручить диффузии, радикально преобразит ваши изображения или любое изображение, которое вы можете загрузить, в соответствии с вашими инструкциями. Модель, разработанная Microsoft Research Asia, представляет собой интерфейс, который объединяет ИИ и человеческие инструкции для создания и выполнения различных визуальных задач.
Другими словами, вы выбираете изображение, которое хотите отредактировать, изменить или преобразовать, и InstructDiffusion использует свое компьютерное зрение, чтобы изменить изображение на основе ваших данных.
Microsoft выпустила бумага
для модели несколько дней назад, и у InstructDiffusion уже есть демонстрационная площадка, где вы сможете опробовать модель на себе.Ключевое нововведение в IntructDiffusion заключается в том, что модели не требуется предварительное знание изображения, вместо этого она использует процесс диффузии для манипулирования пикселями. Модель обладает множеством полезных функций, таких как сегментация, обнаружение ключевых точек и восстановление. Практически InstructDiffusion будет использовать ваши инструкции для изменения изображения.
В одном из примеров Microsoft Research Asia смогла удалить водяной знак с фотографии, просто попросив модель сделать это.
Microsoft InstructDiffusion способен распознать смысл ваших инструкций.
InstructDiffusion, как и многие другие Модели искусственного интеллекта Microsoft, способен к инновационному поведению при решении задач. Microsoft Research Asia утверждает, что InstructDiffusion реализует задачи понимания и порождающие задачи.
Модель будет использовать задачи понимания, такие как сегментация и обнаружение ключевых точек, чтобы определить область и пиксели, которые вы хотите отредактировать.
Например, модель использует сегментацию, чтобы успешно найти область следующей инструкции: закрасьте мужчину справа от изображения красным. Для обнаружения ключевых точек инструкция будет такой: желтым цветом обведите колено человека в крайнем левом углу изображения.
Генеративные задачи состоят из задач редактирования и восстановления. InstructDiffusion не только отредактирует ваше изображение, но и модель сгенерирует новые элементы для изображения на основе ваших инструкций.
Самая многообещающая особенность Microsoft InstructDiffusion — это способность успешно обобщать все получаемые инструкции для формирования связного и глубокого понимания смысла, стоящего за ними. Другими словами, модель запомнит инструкции, которые вы ей дали, и будет успешно использовать их для дальнейшего обучения.
Но модель также научится различать смысл ваших инструкций, что позволит ей решать невидимые задачи и придумывать новые способы генерации элементов. Эта способность понимать семантические значения ставит InstructDifussion на шаг дальше других подобных моделей: она превосходит их.
Однако InstructDiffusion также является шагом вперед. достижения AGI: Благодаря глубокому пониманию семантического значения каждой инструкции и способности успешно обобщать компьютерное видение модель значительно продвинет развитие ИИ.
Microsoft Research Asia позволяет вам попробовать это в демонстрационная площадка, но вы также можете используйте его код для обучения собственной модели ИИ.
Каково ваше мнение об этой модели? Попробуешь?