Новият LLM за кодиране на Microsoft идва след GPT 4

phi-1 е новият езиков модел на Microsoft за кодиране.

  • Microsoft финансира много изследвания на AI.
  • След като обявихме, че Orca ще бъде с отворен код, phi-1 също е тук.
  • phi-1 е способен сам да консолидира знания.
майкрософт фи 1

Microsoft наистина прави голяма крачка в развитието на AI. Миналия месец AI беше в челните редици на конференцията Microsoft Build и базираната в Редмънд технология дори обяви, че Copilot идва в Windows 11. Като родно вградено приложение, за всичко, от което се нуждаете,

AI идва и в Microsoft Teams, в неговия инструмент Recap Ai. И много други инструменти от Microsoft ще използват AI, включително Microsoft Fabric.

Но изглежда, че Microsoft също финансира AI изследвания. Съвсем наскоро технологичният гигант обяви Orca 13B ще бъде с отворен код. И LongMem е друга добра точка в изследванията на AI: това е отговорът за неограничена дължина на контекста.

И сега има време за друг голям пробив в изследванията на AI, идващ от Microsoft, разбира се. Съобщава се, че новият 1.3B-параметър кодиращ модел LLM, наречен phi-1, превъзхожда GPT 3.5 само за 4 дни обучение.

Какво е phi-1 и как вече превъзхожда GPT?

Фи-1 е нов 1.3B-параметър езиков модел за код, със значително по-малък размер от конкурентните модели. Езиковият модел беше обучен в продължение на 4 дни, над 7B токени (малко над 50B общо видяни токени), последвано от фина настройка на по-малко от 200M токени.майкрософт фи 1

Въпреки че е много по-малък от конкурентните модели, phi-1 постигна 50,6% [имейл защитен] точност на HumanEval и 55,5% [имейл защитен] точност на MBPP (предимно основни програми на Python), които са едни от най-добрите самоотчитани числа, използващи само едно поколение LLM.

Освен това, въпреки че е обучен на много по-малко токени в сравнение със съществуващите модели, phi-1 все още има много потенциал.

Подобренията на HumanEval са най-големите постижения на phi-1 като езиков модел. След настройката phi-1 успя да изпълни задачи, които не бяха включени в набора от данни за фина настройка. Това означава, че моделът адаптира и подобри процеса на фина настройка.

И най-забележителното е, че phi-1 реорганизира и консолидира знанията, придобити по време на предварителната подготовка, въпреки че знанията не присъстват изрично там на първо място.

С по-кратки думи, phi-1 не само учи по време на обучение, но и разширява знанията сам. Той успя да надмине GPT 3.5 на всяко ниво и е само въпрос на време малкият модел да се изправи срещу големите, като GPT 4.

Какво мислите за този нов AI модел? Накъде мислите, че се насочват изследванията на ИИ? Не забравяйте да ни кажете вашите мнения в секцията за коментари по-долу.

Новите функции на Azure Files са по-сигурни и лесни за използване

Новите функции на Azure Files са по-сигурни и лесни за използванеMicrosoftСигурностЛазурен

Сигурността винаги е била главен фокус за Microsoft. Напоследък технологичният гигант направи много промени в своята платформа за изчислителни облаци.Започвайки с Център за сигурност на Azure за Io...

Прочетете още
Може ли Microsoft да загуби сделката JEDI?

Може ли Microsoft да загуби сделката JEDI?MicrosoftЛазурен

Microsoft, в най-новата си версия финансов отчет за второто тримесечие, включваше рисков фактор, намекващ за възможността за загуба на държавни сделки, като този, който той сключи с Министерството ...

Прочетете още
Project Rome позволява на разработчиците на Android да създават приложения, които контролират компютри с Windows 10

Project Rome позволява на разработчиците на Android да създават приложения, които контролират компютри с Windows 10MicrosoftПроект Римпроблеми с AndroidWindows 10

Microsoft постави подхода на компанията само за Windows преди няколко години, благодарение на инициативата на компанията за различни платформи, целяща да се справи с конкуренцията. Като част от уси...

Прочетете още