Shepherd is het coole AI-model in de kamer en wijst op de fouten van ons AI-model.
- Shepherd AI is getraind op community-feedback, met name Reddit-forums.
- Het model is ook getraind op gecureerde, door mensen geannoteerde invoer, waardoor de correcties feitelijk zijn.
- Shepherd gebruikt een natuurlijke stem om feedback te geven.
Het is tijd om een stap terug te doen van het bedekken De AI-doorbraken van Microsoft, om een van de modellen te bekijken waaraan haar recente partner, Meta, heeft gewerkt.
Het Facebook-bedrijf financiert ook zelf onderzoek naar AI, en het resultaat is een AI-model dat in staat is om grote taalmodellen (LLM's) te corrigeren en hen te begeleiden bij het verstrekken van de juiste reacties.
Het team achter het project noemde het model suggestief Herder AI, en het model is gebouwd om de fouten aan te pakken die LLM's kunnen maken wanneer ze worden gevraagd om bepaalde taken uit te voeren.
In dit werk introduceren we Shepherd, een taalmodel dat specifiek is afgestemd op kritiekmodelreacties en suggesties verfijningen, die verder gaan dan de mogelijkheden van een niet-afgestemd model om diverse fouten te identificeren en suggesties te doen ze verhelpen. De kern van onze aanpak is een feedbackdataset van hoge kwaliteit, die we samenstellen op basis van communityfeedback en menselijke annotaties.
Meta AI-onderzoek, FAIR
Zoals u wellicht weet, heeft Meta enkele weken geleden zijn LLM's, Llama 2, uitgebracht in samenwerking met Microsoft. Llama 2 is een verbluffend open-sourcemodel met 70 miljard parameters die Microsoft en Meta van plan zijn te commercialiseren voor gebruikers en organisaties om hun interne AI-tools te bouwen.
Maar AI is nog niet perfect. En veel van zijn oplossingen lijken niet altijd te kloppen. Volgens Meta AI Research is Shepherd hier om deze problemen aan te pakken door ze te corrigeren en oplossingen voor te stellen.
Shepherd AI is een informele, natuurlijke AI-leraar
We weten bijvoorbeeld allemaal dat Bing Chat bepaalde patronen moet volgen: de tool kan creatief zijn, maar het kan ook beperk zijn creativiteit. Als het om professionele zaken gaat, kan Bing AI ook een serieuze houding aannemen.
Het lijkt er echter op dat Meta's Shepherd AI werkt als een informele AI-leraar voor de andere LLM's. Het model, dat is aanzienlijk veel kleiner bij 7B parameters, heeft een natuurlijke en informele toon bij het corrigeren en suggereren oplossingen.
Dit was allemaal mogelijk dankzij een verscheidenheid aan bronnen voor training, waaronder:
- Feedback van de gemeenschap: Shepherd AI is getraind op samengestelde inhoud van online forums (met name Reddit-forums), waardoor natuurlijke invoer mogelijk is.
- Door mensen geannoteerde input: Shepherd AI is ook getraind op een reeks geselecteerde openbare databases, waardoor georganiseerde en feitelijke correcties mogelijk zijn.
Deze twee methoden stellen Shepherd AI in staat om echte, gevalideerde oplossingen aan te bieden met een zeer informele toon, waardoor het de beste keuze is voor degenen onder u die de voorkeur geven aan een vriendelijker AI-model om te testen en te corrigeren uw AI's.
Shepherd AI is ondanks zijn relatief kleine infrastructuur perfect in staat om een betere feitelijke correctie te geven dan bijvoorbeeld ChatGPT. FAIR en Meta AI Research ontdekten dat de AI-tool betere resultaten oplevert dan de meeste van zijn concurrerende alternatieven, met een gemiddeld winstpercentage van winstpercentage van 53-87%. Bovendien kan Shepherd AI ook nauwkeurige beoordelingen maken van elke vorm van door LLM gegenereerde inhoud.
Voor nu is Shepherd een nieuw AI-model, maar naarmate er meer onderzoek naar wordt gedaan, zal het model hoogstwaarschijnlijk in de toekomst worden uitgebracht als een open-sourceproject.
Ben je er enthousiast over? Zou je het gebruiken om je eigen AI-model te corrigeren? Wat denk jij ervan?