इंस्ट्रक्टडिफ्यूजन अर्थ संबंधी अर्थों को समझने में सक्षम है और यह आपकी छवियों को संपादित करने के लिए उनका उपयोग करेगा।
- इंस्ट्रक्टडिफ्यूजन एक एआई है जो अर्थ संबंधी अर्थों को समझने की क्षमता हासिल करने के लिए पिछले निर्देशों का उपयोग करने में सक्षम है।
- यह मॉडल प्रभावशाली सामान्यीकरण क्षमताओं में भी सक्षम है।
- एक बार जब यह एक दृश्य संकेत के बारे में सीख लेता है, तो मॉडल खुद को और भी अधिक प्रशिक्षित करने के लिए इसका काफी विस्तार करेगा।
माइक्रोसॉफ्ट का नवीनतम AI मॉडल, प्रसार का निर्देश दें, आपके निर्देशों के अनुसार आपकी छवियों, या आपके द्वारा अपलोड की जा सकने वाली किसी भी छवि को मौलिक रूप से बदल देगा। माइक्रोसॉफ्ट रिसर्च एशिया द्वारा विकसित मॉडल, एक इंटरफ़ेस है जो विभिन्न प्रकार के दृश्य कार्यों को उत्पन्न करने और पूरा करने के लिए एआई और मानव निर्देशों को एक साथ लाता है।
दूसरे शब्दों में, आप एक छवि चुनते हैं जिसे आप संपादित करना, बदलना या बदलना चाहते हैं, और इंस्ट्रक्टडिफ्यूजन आपके इनपुट के आधार पर छवि को बदलने के लिए अपना कंप्यूटर विज़न लाएगा।
माइक्रोसॉफ्ट ने जारी किया कागज़ कुछ दिन पहले के मॉडल के लिए, और इंस्ट्रक्टडिफ़्यूज़न के पास पहले से ही एक है
डेमो खेल का मैदान, जहां आप अपने लिए मॉडल आज़मा सकते हैं।इंट्रक्टडिफ्यूजन में मुख्य नवाचार यह है कि मॉडल को छवि के पूर्व ज्ञान की आवश्यकता नहीं है, बल्कि इसके बजाय, यह पिक्सेल में हेरफेर करने के लिए एक प्रसार प्रक्रिया का उपयोग करता है। मॉडल कई उपयोगी सुविधाओं जैसे सेगमेंटेशन, कीपॉइंट डिटेक्शन और रीस्टोरेशन में सक्षम है। व्यावहारिक रूप से, इंस्ट्रक्टडिफ्यूजन छवि को बदलने के लिए आपके निर्देशों का उपयोग करेगा।
एक उदाहरण में, माइक्रोसॉफ्ट रिसर्च एशिया केवल मॉडल को ऐसा करने का निर्देश देकर, एक तस्वीर पर वॉटरमार्क हटाने में सक्षम था।
माइक्रोसॉफ्ट का इंस्ट्रक्शनडिफ्यूजन आपके निर्देशों के पीछे के अर्थ को अलग करने में सक्षम है
इंस्ट्रक्शनडिफ्यूजन, कई अन्य की तरह माइक्रोसॉफ्ट एआई मॉडल, जब कार्यों को हल करने की बात आती है तो नवोन्मेषी व्यवहार करने में सक्षम होता है। माइक्रोसॉफ्ट रिसर्च एशिया का दावा है कि इंस्ट्रक्टडिफ्यूजन समझने वाले कार्यों और जेनरेटिव कार्यों को लागू करता है।
मॉडल उस क्षेत्र और पिक्सेल का पता लगाने के लिए सेगमेंटेशन और कीपॉइंट डिटेक्शन जैसे समझने के कार्यों का उपयोग करेगा, जिन्हें आप संपादित करना चाहते हैं।
उदाहरण के लिए, मॉडल आपके निम्नलिखित निर्देश के क्षेत्र का सफलतापूर्वक पता लगाने के लिए विभाजन का उपयोग करता है: छवि के दाईं ओर वाले व्यक्ति को लाल रंग से पेंट करें। मुख्य बिंदु का पता लगाने के लिए, एक निर्देश होगा: छवि के सबसे बाईं ओर आदमी के घुटने को घेरने के लिए पीले रंग का उपयोग करें।
सृजनात्मक कार्य संपादन और पुनर्स्थापनात्मक कार्यों से बने होते हैं। न केवल इंस्ट्रक्टडिफ्यूजन आपकी छवि को संपादित करेगा, बल्कि मॉडल आपके निर्देशों के आधार पर छवि के लिए नए तत्व भी उत्पन्न करेगा।
माइक्रोसॉफ्ट इंस्ट्रक्टडिफ्यूजन की सबसे आशाजनक विशेषता यह है कि इसे प्राप्त होने वाले सभी निर्देशों को सफलतापूर्वक सामान्यीकृत करने की क्षमता है ताकि उनके पीछे के अर्थ की एक सामंजस्यपूर्ण और गहरी समझ बनाई जा सके। दूसरे शब्दों में, मॉडल आपके द्वारा उसे दिए गए निर्देशों को याद रखेगा, और वह आगे भी खुद को प्रशिक्षित करने के लिए उनका सफलतापूर्वक उपयोग करेगा।
लेकिन मॉडल आपके निर्देशों के पीछे के अर्थों को अलग करना भी सीखेगा, जिससे यह अनदेखे कार्यों को हल करने और तत्वों को उत्पन्न करने के नए तरीकों के साथ आएगा। अर्थ संबंधी अर्थों को समझने की यह क्षमता इंस्ट्रक्टडिफ्यूजन को अन्य समान मॉडलों की तुलना में एक कदम आगे रखती है: यह उनसे बेहतर प्रदर्शन करती है।
हालाँकि, इंस्ट्रक्टडिफ्यूजन भी एक कदम आगे है एजीआई तक पहुंचने के लिए: प्रत्येक निर्देश के पीछे के अर्थ को गहराई से समझकर, और कंप्यूटर विज़न को सफलतापूर्वक सामान्यीकृत करने में सक्षम होने के कारण, मॉडल एआई विकास को काफी आगे बढ़ाएगा।
माइक्रोसॉफ्ट रिसर्च एशिया आपको इसे आज़माने की अनुमति देता है डेमो खेल का मैदान, लेकिन आप भी कर सकते हैं इसके कोड का उपयोग करें अपने स्वयं के AI मॉडल को प्रशिक्षित करने के लिए।
इस मॉडल पर आपकी क्या राय है? क्या आप इसे आज़माएंगे?