Nové kódovanie LLM od Microsoftu prichádza po GPT 4

phi-1 je nový jazykový model spoločnosti Microsoft pre kódovanie.

Microsoft financuje veľa výskumu AI.
Po oznámení, že Orca bude open source, je tu aj phi-1.
phi-1 je schopný upevniť vedomosti sám o sebe.

Microsoft skutočne robí veľký krok vo vývoji AI. Minulý mesiac bola AI v popredí konferencie Microsoft Build a technológia so sídlom v Redmonde dokonca oznámila, že Copilot prichádza na Windows 11. Ako natívna vstavaná aplikácia pre všetko, čo potrebujete,

AI prichádza aj do Microsoft Teams, vo svojom nástroji Recap Ai. A mnoho ďalších nástrojov od Microsoftu bude využívať AI, vrátane Microsoft Fabric.

Zdá sa však, že Microsoft financuje aj výskum AI. Len nedávno to oznámil technologický gigant Orca 13B bude open source. A LongMem je ďalším dobrým bodom vo výskume AI: je to odpoveď na neobmedzenú dĺžku kontextu.

A teraz je čas na ďalší veľký prielom vo výskume AI, ktorý samozrejme prichádza od spoločnosti Microsoft. Nový model LLM s parametrom 1,3B, nazývaný phi-1, údajne prekonáva GPT 3.5 len za 4 dni školenia.

instagram story viewer

Čo je phi-1 a ako už prekonáva GPT?

Phi-1 je nový jazykový model s parametrami 1,3B pre kód, s výrazne menšou veľkosťou ako konkurenčné modely. Jazykový model bol trénovaný počas 4 dní, viac ako 7B tokenov (celkom bolo videných mierne viac ako 50B tokenov), po ktorých nasledovalo doladenie na menej ako 200 miliónov tokenov. microsoft phi 1

Napriek tomu, že je oveľa menší ako konkurenčné modely, phi-1 dosiahol 50,6 % [e-mail chránený] presnosť na HumanEval a 55,5 % [e-mail chránený] presnosť na MBPP (väčšinou základné Python programy), ktoré sú jedným z najlepších čísiel, ktoré sa sami hlásia pomocou iba jednej generácie LLM.

Navyše, napriek tomu, že je phi-1 vyškolený na oveľa menšom počte tokenov v porovnaní s existujúcimi modelmi, má stále veľa potenciálov.

Vylepšenia HumanEval sú najväčšími úspechmi phi-1 ako jazykového modelu. Po vyladení sa phi-1 podarilo vykonať úlohy, ktoré neboli uvedené v súbore údajov jemného doladenia. To znamená, že model prispôsobil a zlepšil proces jemného ladenia.

A najpozoruhodnejšie je, že phi-1 zreorganizoval a upevnil vedomosti získané počas predtréningu, aj keď tam tie vedomosti v prvom rade vyslovene neboli.

Stručne povedané, phi-1 sa nielen učí počas tréningu, ale aj sám rozširuje vedomosti. Podarilo sa mu prekonať GPT 3.5 na každej úrovni a je len otázkou času, kým malý model prevezme tie veľké, ako je GPT 4.

Čo si myslíte o tomto novom modeli AI? Kam podľa vás smeruje výskum AI? Nezabudnite nám dať vedieť o svojich názoroch v sekcii komentárov nižšie.

Nové kódovanie LLM od Microsoftu prichádza po GPT 4

phi-1 je nový jazykový model spoločnosti Microsoft pre kódovanie.

Čo je phi-1 a ako už prekonáva GPT?

Najnovší patent spoločnosti Microsoft naznačuje prispôsobené používateľské prostredie v službe Teams Microsoft Microsoft 365

Tímy umožnia používateľom dohnať zmeškané hovory pomocou nového tlačidla Microsoft Tímy Spoločnosti Microsoft

Zručnosti poháňané AI prichádzajú do Microsoft Viva: Top 3 funkcie Microsoft Microsoft Viva

Nové kódovanie LLM od Microsoftu prichádza po GPT 4

Čo je phi-1 a ako už prekonáva GPT?

Najnovší patent spoločnosti Microsoft naznačuje prispôsobené používateľské prostredie v službe TeamsMicrosoftMicrosoft 365

Tímy umožnia používateľom dohnať zmeškané hovory pomocou nového tlačidlaMicrosoftTímy Spoločnosti Microsoft

Zručnosti poháňané AI prichádzajú do Microsoft Viva: Top 3 funkcieMicrosoftMicrosoft Viva

Najnovší patent spoločnosti Microsoft naznačuje prispôsobené používateľské prostredie v službe Teams Microsoft Microsoft 365

Tímy umožnia používateľom dohnať zmeškané hovory pomocou nového tlačidla Microsoft Tímy Spoločnosti Microsoft

Zručnosti poháňané AI prichádzajú do Microsoft Viva: Top 3 funkcie Microsoft Microsoft Viva