AI 개발은 대부분 오픈 소스이므로 AI 모델은 유사한 훈련 패턴으로 훈련됩니다.
- WizardLM 또는 WizardCoder는 현재 시장에 나와 있는 최고의 AI 코더 중 하나입니다.
- WizardLM은 경쟁사인 Phind가 원본 작업을 인정하지 않고 WizardCoder 모델을 사용하여 스스로 훈련했다고 주장합니다.
- Phind 뒤에 있는 회사는 WizardLM의 주장을 부인합니다.
WizardCoder를 기억하세요, 최근 Windows 보고서에서 다룬 AI 코더는 무엇입니까? 우리는 다음과 같이 선전했습니다. 세계 최고의 AI 코더, 그 당시에는 그럴 만한 이유가 있었습니다. WizardLM이라는 이름으로도 알려진 WizardCoder는 자체적으로 코드 블록을 올바르게 작성할 수 있습니다. 그리고 AI 도구로서 프로그래머가 더 빠르게 코딩하는 데 큰 도움이 될 수 있습니다.
그리고 그 명성이 너무 높아져서 WizardLM의 교육 프로세스가 Phind라는 타사 AI 모델에 복제된 것 같습니다. 그러나 여기에 문제가 있습니다. WizardLM 뒤에 있는 Microsoft 자금 지원 팀은 Phind 팀이 자신의 작업을 인정하지도 않은 채 모든 작업을 훔쳤다고 주장합니다.
기억하신다면, WizardLM 자체 AI 모델을 훈련하는 데 사용할 수 있는 오픈 소스 모델입니다. 하지만, AI 파트너십 AI 개발의 진정한 원동력이며 WizardLM 팀은 자신의 작업이 다른 AI 모델을 훈련하는 데 사용될 때 인정받기를 원합니다.
Phind 뒤에 있는 회사그러나 WizardLM 팀은 그들의 작업이 실제로 타사 Phind 모델을 생성하는 데 사용되었다는 증거를 가지고 있음에도 불구하고 WizardLM을 사용하여 모델을 구축했다는 사실을 부인합니다.
WizardLM과 Phind: AI 모델 간의 최초의 문서화된 불화
WizardLM에 따르면:
- Phind는 WizardCoder Evol-Instruct 메서드에서 수행된 WizardCoder 스타일 데이터 세트라는 데이터를 사용하여 V1 Code Llama 모델을 교육합니다.
- 그런 다음 WizardCoder 모델의 방법을 계속 사용하여 V2 모델을 교육합니다.
- 그들은 사용법을 인정하지 않으며 WizardCoder에서 아무것도 사용하지 않는다고 주장합니다.
이들 모두는 명백한 충돌을 자세히 설명하는 사진과 스크린샷으로 발견되어 체포되었습니다. 반면에 Phind 팀은 Phind를 교육하는 데 WizardLM 모델을 사용하지 않았다고 말합니다.
다시 말하지만, 우리는 그들의 모델을 사용하지 않았습니다. 우리의 v1 모델(WizardCoder 이전에 출시됨)은 우리가 직접 만든 WizardCoder 스타일 데이터 세트로 훈련되었으며 이것이 모델의 내부 명명법이었습니다.
핀드 팀
어떤 사람들은 AI 개발에 대해 논쟁을 벌이기보다 두 당사자 간의 파트너십이나 협력이 AI 개발을 발전시키는 데 더 많은 도움이 될 것이라고 제안했습니다. 사실 AI 개발은 항상 대부분 오픈 소스이므로 모델은 정확한 훈련 패턴은 아니더라도 유사할 것입니다.
그러나 AI 모델이 다른 모델의 훈련 패턴으로 훈련된 경우 작업에 대한 공로를 인정하는 것이 공정합니다. 결국 이는 길고 유익한 파트너십의 기초가 될 수 있습니다.
이 상황에 대해 어떻게 생각하시나요?