मेटा के शेफर्ड एआई से मिलें, गाइड एआई जो एलएलएम को सही करता है

शेफर्ड कमरे में शानदार एआई मॉडल है, जो आपके एआई मॉडल की गलतियों की ओर इशारा करता है।

  • शेफर्ड एआई को सामुदायिक फीडबैक, विशेष रूप से रेडिट मंचों पर प्रशिक्षित किया गया था।
  • मॉडल को क्यूरेटेड मानव-एनोटेटेड इनपुट पर भी प्रशिक्षित किया गया था, जो इसके सुधारों को तथ्यात्मक बनाता है।
  • शेफर्ड अपनी प्रतिक्रिया देने के लिए प्राकृतिक आवाज़ का उपयोग करता है।
चरवाहा ए.आई

अब कवरिंग से एक कदम पीछे हटने का समय आ गया है माइक्रोसॉफ्ट की एआई सफलताएँ, उन मॉडलों में से एक पर नज़र डालने के लिए जिस पर उसका हालिया साझेदार मेटा काम कर रहा है।

फेसबुक कंपनी अपने दम पर भी एआई पर अनुसंधान को वित्त पोषित कर रही है, और इसका परिणाम एआई मॉडल है जो बड़े भाषा मॉडल (एलएलएम) को सही करने और उन्हें सही प्रदान करने में मार्गदर्शन करने में सक्षम है प्रतिक्रियाएं.

परियोजना के पीछे की टीम ने सुझावपूर्वक मॉडल को बुलाया चरवाहा ए.आई, और मॉडल उन गलतियों को संबोधित करने के लिए बनाया गया है जो एलएलएम कुछ कार्यों को पूरा करने के लिए कहने पर कर सकते हैं।

इस काम में, हम शेफर्ड का परिचय देते हैं, एक भाषा मॉडल जो विशेष रूप से आलोचना मॉडल प्रतिक्रियाओं और सुझावों के लिए तैयार किया गया है परिशोधन, विभिन्न त्रुटियों की पहचान करने और सुझाव प्रदान करने के लिए एक अनट्यून किए गए मॉडल की क्षमताओं से परे विस्तार करना उनका उपाय करें. हमारे दृष्टिकोण के मूल में एक उच्च गुणवत्ता वाला फीडबैक डेटासेट है, जिसे हम सामुदायिक फीडबैक और मानव एनोटेशन से तैयार करते हैं।

मेटा एआई अनुसंधान, एफएआईआर

जैसा कि आप जानते होंगे, मेटा ने कई सप्ताह पहले माइक्रोसॉफ्ट के साथ साझेदारी में अपना एलएलएम, लामा 2 जारी किया था। लामा 2 एक चौंका देने वाला 70बी पैरामीटर वाला ओपन-सोर्स मॉडल है माइक्रोसॉफ्ट और मेटा अपने इन-हाउस एआई उपकरण बनाने के लिए उपयोगकर्ताओं और संगठनों को व्यावसायीकरण करने की योजना बना रहे हैं।

लेकिन AI अभी भी पूर्ण नहीं है। और इसके कई समाधान हमेशा सही प्रतीत नहीं होता. मेटा एआई रिसर्च के अनुसार, शेफर्ड इन मुद्दों को सुधारने और समाधान सुझाने के लिए यहां है।

शेफर्ड एआई एक अनौपचारिक, प्राकृतिक एआई शिक्षक है

उदाहरण के लिए, हम सभी जानते हैं कि बिंग चैट को कुछ पैटर्न का पालन करना पड़ता है: उपकरण रचनात्मक हो सकता है, लेकिन यह भी हो सकता है इसकी रचनात्मकता को सीमित करें. जब पेशेवर मामलों की बात आती है, तो बिंग एआई भी गंभीर रवैया अपना सकता है।

हालाँकि, ऐसा लगता है कि मेटा का शेफर्ड एआई अन्य एलएलएम के लिए एक अनौपचारिक एआई शिक्षक के रूप में काम करता है। मॉडल, जो है 7बी मापदंडों पर काफी छोटा, सुधार और सुझाव देते समय आवाज का स्वर स्वाभाविक और अनौपचारिक होता है समाधान।

यह सब प्रशिक्षण के विभिन्न स्रोतों की बदौलत संभव हुआ, जिनमें शामिल हैं:

  • सामुदायिक प्रतिक्रिया: शेफर्ड एआई को ऑनलाइन फ़ोरम (विशेष रूप से रेडिट फ़ोरम) से क्यूरेटेड सामग्री पर प्रशिक्षित किया गया था, जो इसके प्राकृतिक इनपुट को सक्षम बनाता है।
  • मानव-एनोटेटेड इनपुट: शेफर्ड एआई को चयनित सार्वजनिक डेटाबेस के एक सेट पर भी प्रशिक्षित किया गया था, जो इसके संगठित और तथ्यात्मक सुधार को सक्षम बनाता है।

ये दो विधियाँ शेफर्ड एआई को बहुत ही अनौपचारिक लहजे में वास्तविक, मान्य समाधान पेश करने की अनुमति देती हैं, यह आपमें से उन लोगों के लिए सबसे अच्छा विकल्प है जो परीक्षण और सुधार के लिए अधिक अनुकूल एआई मॉडल पसंद करते हैं आपके एआई.चरवाहा ए.आई

उदाहरण के लिए, अपने अपेक्षाकृत छोटे बुनियादी ढांचे के बावजूद, शेफर्ड एआई चैटजीपीटी की तुलना में बेहतर तथ्यात्मक सुधार प्रदान करने में पूरी तरह से सक्षम है। एफएआईआर और मेटा एआई रिसर्च ने पाया कि एआई टूल अपने अधिकांश प्रतिस्पर्धी विकल्पों की तुलना में बेहतर परिणाम प्रदान करता है, जिसकी औसत जीत दर है जीत-दर 53-87%. साथ ही, शेफर्ड एआई किसी भी प्रकार की एलएलएम-जनित सामग्री पर सटीक निर्णय भी ले सकता है।

अभी के लिए, शेफर्ड एक नया एआई मॉडल है, लेकिन जैसे-जैसे इसमें अधिक शोध किया जाएगा, मॉडल को भविष्य में एक ओपन-सोर्स प्रोजेक्ट के रूप में जारी किए जाने की संभावना है।

क्या आप इसे लेकर उत्साहित हैं? क्या आप इसका उपयोग अपने एआई मॉडल को सही करने के लिए करेंगे? आप इसके बारे में क्या सोचते हैं?

पीसी पर गेमिंग के लिए कौन सा एंड्रॉइड एमुलेटर सबसे अच्छा है?

पीसी पर गेमिंग के लिए कौन सा एंड्रॉइड एमुलेटर सबसे अच्छा है?सॉफ्टवेयरएंड्रॉइड एमुलेटर

समय बचाने वाला सॉफ्टवेयर और हार्डवेयर विशेषज्ञता जो सालाना 200M उपयोगकर्ताओं की मदद करती है। अपने तकनीकी जीवन को उन्नत करने के लिए सलाह, समाचार और युक्तियों के साथ आपका मार्गदर्शन करना।हम LDPlayer ...

अधिक पढ़ें
आपके खेल के लिए सर्वश्रेष्ठ टेनिस विश्लेषण सॉफ्टवेयर [२०२१ गाइड]

आपके खेल के लिए सर्वश्रेष्ठ टेनिस विश्लेषण सॉफ्टवेयर [२०२१ गाइड]सॉफ्टवेयर

समय बचाने वाला सॉफ्टवेयर और हार्डवेयर विशेषज्ञता जो सालाना 200M उपयोगकर्ताओं की मदद करती है। अपने तकनीकी जीवन को उन्नत करने के लिए सलाह, समाचार और युक्तियों के साथ आपका मार्गदर्शन करना। डार्टफिश डा...

अधिक पढ़ें
मैकेनिक्स के लिए 3 सर्वश्रेष्ठ कार डायग्नोस्टिक सॉफ्टवेयर [२०२१ गाइड]

मैकेनिक्स के लिए 3 सर्वश्रेष्ठ कार डायग्नोस्टिक सॉफ्टवेयर [२०२१ गाइड]Obd2 फाड़नेवालासॉफ्टवेयर

सर्वश्रेष्ठ कार डायग्नोस्टिक सॉफ़्टवेयर की तलाश है जो आपको मैकेनिक के पास एक या दो बार यात्रा करने से बचाएगा?आप भाग्यशाली हैं क्योंकि हमने आपके पीसी के साथ जुड़ने के लिए सर्वश्रेष्ठ ओबीडी सॉफ्टवेयर...

अधिक पढ़ें