Les développements de l'IA sont pour la plupart open source, de sorte que les modèles d'IA sont formés selon des modèles de formation similaires.
- WizardLM, ou WizardCoder, est actuellement l'un des meilleurs codeurs d'IA du marché.
- WizardLM affirme que Phind, un concurrent, a utilisé le modèle WizardCoder pour s'entraîner, sans créditer le travail original.
- La société derrière Phind nie les affirmations de WizardLM.
Rappelez-vous WizardCoder, le codeur d'IA que nous avons récemment abordé ici dans Windows Report? Nous avons vanté comme le meilleur codeur IA au monde, à l’époque, et pour cause. WizardCoder, également connu sous le nom de WizardLM, est capable d'écrire correctement des blocs de code par lui-même. Et en tant qu’outil d’IA, il peut grandement aider les programmeurs à coder plus rapidement.
Et sa réputation s’est tellement développée qu’il semble que le processus de formation de WizardLM ait été reproduit dans un modèle d’IA tiers, appelé Phind. Mais voici le hic: l’équipe financée par Microsoft derrière WizardLM affirme que l’équipe Phind a volé tout leur travail, sans même les créditer.
Si tu te souviens, AssistantLM est un modèle open source qui peut être utilisé pour entraîner votre propre modèle d'IA. Cependant, Partenariats IA sont le véritable moteur du développement de l'IA, et l'équipe WizardLM veut simplement être créditée lorsque son travail est utilisé pour former d'autres modèles d'IA.
L'entreprise derrière Phind, cependant, nie avoir utilisé WizardLM pour construire le modèle, même si l'équipe WizardLM dispose de preuves prouvant que leur travail a effectivement été utilisé pour créer le modèle Phind tiers.
WizardLM et Phind: une première querelle documentée entre modèles d'IA
D'après WizardLM:
- Phind utilise un ensemble de données nommé WizardCoder, réalisé à partir de la méthode WizardCoder Evol-Instruct pour entraîner son modèle V1 Code Llama.
- Ensuite, ils continuent à utiliser les méthodes d'un modèle WizardCoder pour entraîner leur modèle V2.
- Ils ne reconnaissent pas l'utilisation et prétendent ne rien utiliser de WizardCoder.
Tous ces éléments ont été repérés et appréhendés avec des photos et des captures d’écran détaillant le conflit apparent. D’un autre côté, l’équipe Phind affirme qu’elle n’a pas utilisé le modèle WizardLM pour former Phind.
Encore une fois, nous n’avons pas utilisé leur modèle. Notre modèle v1 (publié avant WizardCoder) a été formé sur un ensemble de données de style WizardCoder que nous avons créé nous-mêmes et c'était la nomenclature interne du modèle.
L'équipe Phind
Certaines personnes ont suggéré qu’un partenariat ou une collaboration entre les deux parties ferait plus pour faire progresser le développement de l’IA que des disputes à ce sujet. La vérité est que le développement de l’IA est principalement open source, en permanence, de sorte que les modèles auront des modèles de formation similaires, voire exacts.
Cependant, si votre modèle d’IA est entraîné sur le modèle d’entraînement d’un autre modèle, il est alors tout à fait juste de créditer le travail. Après tout, cela pourrait être la base d’un partenariat long et fructueux.
Que pensez-vous de cette situation ?