शेफर्ड कमरे में शानदार एआई मॉडल है, जो आपके एआई मॉडल की गलतियों की ओर इशारा करता है।
- शेफर्ड एआई को सामुदायिक फीडबैक, विशेष रूप से रेडिट मंचों पर प्रशिक्षित किया गया था।
- मॉडल को क्यूरेटेड मानव-एनोटेटेड इनपुट पर भी प्रशिक्षित किया गया था, जो इसके सुधारों को तथ्यात्मक बनाता है।
- शेफर्ड अपनी प्रतिक्रिया देने के लिए प्राकृतिक आवाज़ का उपयोग करता है।

अब कवरिंग से एक कदम पीछे हटने का समय आ गया है माइक्रोसॉफ्ट की एआई सफलताएँ, उन मॉडलों में से एक पर नज़र डालने के लिए जिस पर उसका हालिया साझेदार मेटा काम कर रहा है।
फेसबुक कंपनी अपने दम पर भी एआई पर अनुसंधान को वित्त पोषित कर रही है, और इसका परिणाम एआई मॉडल है जो बड़े भाषा मॉडल (एलएलएम) को सही करने और उन्हें सही प्रदान करने में मार्गदर्शन करने में सक्षम है प्रतिक्रियाएं.
परियोजना के पीछे की टीम ने सुझावपूर्वक मॉडल को बुलाया चरवाहा ए.आई, और मॉडल उन गलतियों को संबोधित करने के लिए बनाया गया है जो एलएलएम कुछ कार्यों को पूरा करने के लिए कहने पर कर सकते हैं।
इस काम में, हम शेफर्ड का परिचय देते हैं, एक भाषा मॉडल जो विशेष रूप से आलोचना मॉडल प्रतिक्रियाओं और सुझावों के लिए तैयार किया गया है परिशोधन, विभिन्न त्रुटियों की पहचान करने और सुझाव प्रदान करने के लिए एक अनट्यून किए गए मॉडल की क्षमताओं से परे विस्तार करना उनका उपाय करें. हमारे दृष्टिकोण के मूल में एक उच्च गुणवत्ता वाला फीडबैक डेटासेट है, जिसे हम सामुदायिक फीडबैक और मानव एनोटेशन से तैयार करते हैं।
मेटा एआई अनुसंधान, एफएआईआर
जैसा कि आप जानते होंगे, मेटा ने कई सप्ताह पहले माइक्रोसॉफ्ट के साथ साझेदारी में अपना एलएलएम, लामा 2 जारी किया था। लामा 2 एक चौंका देने वाला 70बी पैरामीटर वाला ओपन-सोर्स मॉडल है माइक्रोसॉफ्ट और मेटा अपने इन-हाउस एआई उपकरण बनाने के लिए उपयोगकर्ताओं और संगठनों को व्यावसायीकरण करने की योजना बना रहे हैं।
लेकिन AI अभी भी पूर्ण नहीं है। और इसके कई समाधान हमेशा सही प्रतीत नहीं होता. मेटा एआई रिसर्च के अनुसार, शेफर्ड इन मुद्दों को सुधारने और समाधान सुझाने के लिए यहां है।
शेफर्ड एआई एक अनौपचारिक, प्राकृतिक एआई शिक्षक है
उदाहरण के लिए, हम सभी जानते हैं कि बिंग चैट को कुछ पैटर्न का पालन करना पड़ता है: उपकरण रचनात्मक हो सकता है, लेकिन यह भी हो सकता है इसकी रचनात्मकता को सीमित करें. जब पेशेवर मामलों की बात आती है, तो बिंग एआई भी गंभीर रवैया अपना सकता है।
हालाँकि, ऐसा लगता है कि मेटा का शेफर्ड एआई अन्य एलएलएम के लिए एक अनौपचारिक एआई शिक्षक के रूप में काम करता है। मॉडल, जो है 7बी मापदंडों पर काफी छोटा, सुधार और सुझाव देते समय आवाज का स्वर स्वाभाविक और अनौपचारिक होता है समाधान।
यह सब प्रशिक्षण के विभिन्न स्रोतों की बदौलत संभव हुआ, जिनमें शामिल हैं:
- सामुदायिक प्रतिक्रिया: शेफर्ड एआई को ऑनलाइन फ़ोरम (विशेष रूप से रेडिट फ़ोरम) से क्यूरेटेड सामग्री पर प्रशिक्षित किया गया था, जो इसके प्राकृतिक इनपुट को सक्षम बनाता है।
- मानव-एनोटेटेड इनपुट: शेफर्ड एआई को चयनित सार्वजनिक डेटाबेस के एक सेट पर भी प्रशिक्षित किया गया था, जो इसके संगठित और तथ्यात्मक सुधार को सक्षम बनाता है।
ये दो विधियाँ शेफर्ड एआई को बहुत ही अनौपचारिक लहजे में वास्तविक, मान्य समाधान पेश करने की अनुमति देती हैं, यह आपमें से उन लोगों के लिए सबसे अच्छा विकल्प है जो परीक्षण और सुधार के लिए अधिक अनुकूल एआई मॉडल पसंद करते हैं आपके एआई.
उदाहरण के लिए, अपने अपेक्षाकृत छोटे बुनियादी ढांचे के बावजूद, शेफर्ड एआई चैटजीपीटी की तुलना में बेहतर तथ्यात्मक सुधार प्रदान करने में पूरी तरह से सक्षम है। एफएआईआर और मेटा एआई रिसर्च ने पाया कि एआई टूल अपने अधिकांश प्रतिस्पर्धी विकल्पों की तुलना में बेहतर परिणाम प्रदान करता है, जिसकी औसत जीत दर है जीत-दर 53-87%. साथ ही, शेफर्ड एआई किसी भी प्रकार की एलएलएम-जनित सामग्री पर सटीक निर्णय भी ले सकता है।
अभी के लिए, शेफर्ड एक नया एआई मॉडल है, लेकिन जैसे-जैसे इसमें अधिक शोध किया जाएगा, मॉडल को भविष्य में एक ओपन-सोर्स प्रोजेक्ट के रूप में जारी किए जाने की संभावना है।
क्या आप इसे लेकर उत्साहित हैं? क्या आप इसका उपयोग अपने एआई मॉडल को सही करने के लिए करेंगे? आप इसके बारे में क्या सोचते हैं?