Os desenvolvimentos de IA são, em sua maioria, de código aberto, portanto, os modelos de IA são treinados em padrões de treinamento semelhantes.
- WizardLM, ou WizardCoder, é um dos melhores codificadores de IA do mercado atualmente.
- A WizardLM afirma que Phind, um concorrente, usou o modelo WizardCoder para se treinar, sem creditar o trabalho original.
- A empresa por trás do Phind nega as afirmações feitas pela WizardLM.
Lembre-se do WizardCoder, o codificador de IA que abordamos recentemente aqui no Windows Report? Nós elogiamos como o melhor codificador de IA do mundo, naquela época, e por um bom motivo. WizardCoder, que também atende pelo nome de WizardLM, é capaz de escrever blocos de código corretamente por si só. E como uma ferramenta de IA, pode ajudar muito os programadores a codificar com mais rapidez.
E sua reputação cresceu tanto que parece que o processo de treinamento do WizardLM foi replicado em um modelo de IA de terceiros, chamado Phind. Mas aqui está o problema: a equipe financiada pela Microsoft por trás do WizardLM afirma que a equipe Phind roubou todo o seu trabalho, sem sequer creditá-los.
Se você lembrar, WizardLM é um modelo de código aberto que pode ser usado para treinar seu próprio modelo de IA. No entanto, Parcerias de IA são a verdadeira força motriz por trás do desenvolvimento de IA, e a equipe WizardLM só quer ser creditada quando seu trabalho for usado para treinar outros modelos de IA.
A empresa por trás da Phind, no entanto, nega ter usado o WizardLM para construir o modelo, embora a equipe do WizardLM tenha evidências que comprovem que seu trabalho foi de fato usado para criar o modelo Phind de terceiros.
WizardLM e Phind: uma primeira rivalidade documentada entre modelos de IA
De acordo com WizardLM:
- Phind usa um conjunto de dados chamado WizardCoder estilo conduzido a partir do método WizardCoder Evol-Instruct para treinar seu modelo V1 Code Llama.
- Em seguida, eles continuam a usar métodos de um modelo WizardCoder para treinar seu modelo V2.
- Eles não reconhecem o uso e afirmam não usar nada do WizardCoder.
Todos estes foram avistados e apreendidos com fotos e capturas de tela detalhando o aparente conflito. Por outro lado, a equipe Phind diz que não usou o modelo WizardLM para treinar Phind.
Novamente, não usamos o modelo deles. Nosso modelo v1 (lançado antes do WizardCoder) foi treinado em um conjunto de dados estilo WizardCoder que nós mesmos criamos e esta foi a nomenclatura interna do modelo.
Equipe Phind
Algumas pessoas sugeriram que uma parceria ou colaboração entre as duas partes faria mais para promover o desenvolvimento da IA do que discutir sobre isso. A verdade é que o desenvolvimento de IA é principalmente de código aberto, o tempo todo, então os modelos terão padrões de treinamento semelhantes, se não exatos.
No entanto, se o seu modelo de IA for treinado no padrão de treinamento de outro modelo, então é justo dar crédito ao trabalho. Afinal, esta poderá ser a base de uma parceria longa e frutífera.
O que você acha dessa situação?