AI-utviklingen er for det meste åpen kildekode, så AI-modeller er trent på lignende treningsmønstre.
- WizardLM, eller WizardCoder, er en av de beste AI-koderne på markedet akkurat nå.
- WizardLM hevder at Phind, en konkurrent, brukte WizardCoder-modellen for å trene seg selv, uten å kreditere det originale arbeidet.
- Selskapet bak Phind avviser påstandene fra WizardLM.
Husk WizardCoder, AI-koderen som vi nylig dekket her på Windows Report? Vi spioneringen som den beste AI-koderen i verden, den gang, og med god grunn. WizardCoder, som også går under navnet WizardLM, er i stand til å skrive kodeblokker korrekt av seg selv. Og som et AI-verktøy kan det hjelpe programmerere med å kode raskere.
Og ryktet har vokst så mye at det ser ut til at WizardLMs treningsprosess har blitt replikert til en tredjeparts AI-modell, kalt Phind. Men her er fangsten: det Microsoft-finansierte teamet bak WizardLM hevder at Phind-teamet stjal alt arbeidet deres, uten engang å kreditere dem.
Hvis du husker, WizardLM er en åpen kildekode-modell som kan brukes til å trene din egen AI-modell. Derimot,
AI-partnerskap er den virkelige drivkraften bak AI-utvikling, og WizardLM-teamet ønsker bare å bli kreditert når arbeidet deres brukes til å trene andre AI-modeller.Selskapet bak Phind, men benekter at de har brukt WizardLM til å bygge modellen, selv om WizardLM-teamet har bevis som beviser at arbeidet deres faktisk ble brukt til å lage tredjeparts Phind-modellen.
WizardLM og Phind: En første dokumentert feide mellom AI-modeller
Ifølge WizardLM:
- Phind bruker et data kalt WizardCoder-stil datasett utført fra WizardCoder Evol-Instruct-metoden for å trene deres V1 Code Llama-modell.
- Deretter fortsetter de å bruke metoder fra en WizardCoder-modell for å trene opp sin V2-modell.
- De erkjenner ikke bruken og de hevder at de ikke bruker noe fra WizardCoder.
Alle disse ble oppdaget og pågrepet med bilder og skjermbilder som beskriver den tilsynelatende konflikten. På den andre siden sier Phind-teamet at de ikke brukte WizardLM-modellen for å trene Phind.
Igjen, vi brukte ikke modellen deres. Vår v1-modell (utgitt før WizardCoder) ble trent på et datasett i WizardCoder-stil som vi laget selv, og dette var den interne nomenklaturen for modellen.
Phind team
Noen foreslo at et partnerskap eller et samarbeid mellom de to partene ville gjøre mer for å fremme AI-utvikling enn å krangle om det. Sannheten er at AI-utvikling for det meste er åpen kildekode, hele tiden, så modeller vil ha lignende om ikke eksakte treningsmønstre.
Imidlertid, hvis AI-modellen din er trent på en annen modells treningsmønster, er det bare rettferdig å kreditere arbeidet. Tross alt kan dette være grunnlaget for et langt og fruktbart samarbeid.
Hva synes du om denne situasjonen?