InstructDiffusion قادر على فهم المعاني الدلالية وسيستخدمها لتحرير صورك.
- InstructDiffusion هو ذكاء اصطناعي قادر على استخدام التعليمات السابقة لاكتساب القدرة على فهم المعاني الدلالية.
- النموذج قادر أيضًا على توفير قدرات تعميمية مثيرة للإعجاب.
- بمجرد أن يتعلم النموذج عن إشارة بصرية، سيتوسع فيها بشكل كبير لتدريب نفسه بشكل أكبر.
أحدث نموذج للذكاء الاصطناعي من مايكروسوفت، إرشاد الانتشار، سوف يقوم بتحويل صورك، أو أي صورة يمكنك تحميلها بشكل جذري، وفقًا لتعليماتك. النموذج، الذي طورته شركة Microsoft Research Asia، عبارة عن واجهة تجمع بين الذكاء الاصطناعي والتعليمات البشرية لإنشاء وإكمال مجموعة متنوعة من المهام المرئية.
بمعنى آخر، يمكنك اختيار الصورة التي تريد تحريرها أو تغييرها أو تحويلها، وسوف يقوم InstructDiffusion بتفعيل رؤية الكمبيوتر الخاصة به لتغيير الصورة بناءً على مدخلاتك.
أصدرت مايكروسوفت الورقة للنموذج منذ بضعة أيام، ولدى InstructDiffusion بالفعل ملف ملعب تجريبيحيث يمكنك تجربة النموذج بنفسك.
الابتكار الرئيسي في IntructDiffusion هو أن النموذج لا يحتاج إلى معرفة مسبقة بالصورة، ولكنه بدلاً من ذلك يستخدم عملية نشر لمعالجة وحدات البكسل. النموذج قادر على توفير الكثير من الميزات المفيدة مثل التجزئة واكتشاف النقاط الرئيسية والاستعادة. من الناحية العملية، سوف يستخدم InstructDiffusion تعليماتك لتغيير الصورة.
في أحد الأمثلة، تمكنت Microsoft Research Asia من إزالة العلامة المائية من الصورة، وذلك ببساطة عن طريق توجيه النموذج للقيام بذلك.
يستطيع InstructDiffusion من Microsoft تمييز المعنى الكامن وراء تعليماتك
InstructDiffusion، مثل العديد من الآخرين نماذج مايكروسوفت للذكاء الاصطناعيقادر على السلوك المبتكر عندما يتعلق الأمر بحل المهام. تدعي Microsoft Research Asia أن InstructDiffusion ينفذ مهام الفهم والمهام التوليدية.
سيستخدم النموذج مهام الفهم، مثل التجزئة واكتشافات النقاط الرئيسية لتحديد المنطقة ووحدات البكسل التي تريد تحريرها.
على سبيل المثال، يستخدم النموذج التجزئة لتحديد موقع منطقة التعليمات التالية بنجاح: قم بطلاء الرجل الموجود على يمين الصورة باللون الأحمر. بالنسبة لاكتشافات النقاط الرئيسية، ستكون التعليمات كالتالي: استخدم اللون الأصفر لتطويق ركبة الرجل الموجود في أقصى يسار الصورة.
تتكون المهام التوليدية من مهام التحرير والترميم. لن يقوم InstructDiffusion بتحرير صورتك فحسب، بل سيقوم النموذج أيضًا بإنشاء عناصر جديدة للصورة، بناءً على تعليماتك.
الميزة الأكثر واعدة في Microsoft InstructDiffusion هي قدرته على تعميم جميع التعليمات التي يتلقاها بنجاح لتكوين فهم متماسك وعميق للمعنى الكامن وراءها. بمعنى آخر، سيتذكر النموذج التعليمات التي قدمتها له، وسيستخدمها بنجاح لتدريب نفسه بشكل أكبر.
لكن النموذج سيتعلم أيضًا تمييز المعاني وراء تعليماتك، مما يؤدي به إلى حل المهام غير المرئية والتوصل إلى طرق جديدة لإنشاء العناصر. هذه القدرة على فهم المعاني الدلالية تضع InstructDifussion خطوة أبعد من النماذج المماثلة الأخرى: فهي تتفوق عليها.
ومع ذلك، يعد InstructDiffusion أيضًا خطوة أخرى إلى الأمام للوصول إلى AGI: من خلال الفهم العميق للمعنى الدلالي وراء كل تعليمات، والقدرة على تعميم رؤى الكمبيوتر بنجاح، سيعمل النموذج على تعزيز تطوير الذكاء الاصطناعي بشكل كبير.
يسمح لك Microsoft Research Asia بتجربته في ملف ملعب تجريبي، ولكن يمكنك أيضًا استخدم الكود الخاص به لتدريب نموذج الذكاء الاصطناعي الخاص بك.
ما هي آرائكم حول هذا النموذج؟ هل ستجربه؟