Los desarrollos de IA son en su mayoría de código abierto, por lo que los modelos de IA se entrenan con patrones de entrenamiento similares.
- WizardLM, o WizardCoder, es uno de los mejores codificadores de IA del mercado en este momento.
- WizardLM afirma que Phind, un competidor, utilizó el modelo WizardCoder para entrenarse, sin acreditar el trabajo original.
- La empresa detrás de Phind niega las afirmaciones de WizardLM.
Recuerde WizardCoder, ¿el codificador de IA que cubrimos recientemente aquí en Windows Report? promocionamos como el mejor codificador de IA del mundo, en aquel entonces, y por una buena razón. WizardCoder, que también recibe el nombre de WizardLM, es capaz de escribir correctamente bloques de código por sí solo. Y como herramienta de inteligencia artificial, puede ayudar enormemente a los programadores a codificar más rápido.
Y su reputación ha crecido tanto que parece que el proceso de formación de WizardLM se ha replicado en un modelo de IA de terceros, llamado Phind. Pero aquí está el problema: el equipo detrás de WizardLM, financiado por Microsoft, afirma que el equipo de Phind robó todo su trabajo, sin siquiera darles crédito.
Si tu recuerdas, AsistenteLM es un modelo de código abierto que se puede utilizar para entrenar su propio modelo de IA. Sin embargo, Asociaciones de IA son la verdadera fuerza impulsora detrás del desarrollo de la IA, y el equipo de WizardLM solo quiere recibir crédito cuando su trabajo se utilice para entrenar otros modelos de IA.
La empresa detrás de Phind, sin embargo, niega haber utilizado WizardLM para construir el modelo, a pesar de que el equipo de WizardLM tiene pruebas que demuestran que su trabajo efectivamente se utilizó para crear el modelo Phind de terceros.
WizardLM y Phind: una primera disputa documentada entre modelos de IA
Según WizardLM:
- Phind utiliza un conjunto de datos denominado conjunto de datos estilo WizardCoder realizado a partir del método WizardCoder Evol-Instruct para entrenar su modelo V1 Code Llama.
- Luego continúan usando métodos de un modelo WizardCoder para entrenar su modelo V2.
- No reconocen el uso y afirman que no utilizan nada de WizardCoder.
Todos estos fueron vistos y detenidos con fotografías y capturas de pantalla que detallan el aparente conflicto. Por otro lado, el equipo de Phind dice que no utilizaron el modelo WizardLM para entrenar a Phind.
Una vez más, no utilizamos su modelo. Nuestro modelo v1 (lanzado antes de WizardCoder) se entrenó en un conjunto de datos estilo WizardCoder que creamos nosotros mismos y esta fue la nomenclatura interna del modelo.
Equipo Phind
Algunas personas sugirieron que una asociación o colaboración entre las dos partes haría más para avanzar en el desarrollo de la IA que discutir al respecto. La verdad es que el desarrollo de la IA es mayoritariamente de código abierto todo el tiempo, por lo que los modelos tendrán patrones de entrenamiento similares, si no exactos.
Sin embargo, si su modelo de IA está entrenado con el patrón de entrenamiento de otro modelo, entonces es justo darle crédito al trabajo. Al fin y al cabo, esta podría ser la base de una asociación larga y fructífera.
¿Qué opinas de esta situación?