Noul cadru va revoluționa modelele AI.
- Cadrul face posibilă o lungime nelimitată a contextului.
- O lungime nelimitată a contextului înseamnă o conversație mai personalizată cu modele AI.
- Este practic următorul pas pentru AI pentru a deveni pe deplin aproape de om.
Microsoft a fost în fruntea educației AI și a instrumentelor AI, în general. Copilot vine în Windows 11 foarte curând, ca parte a actualizărilor Windows. AI își face loc în Microsoft Teams, cu un recapitulare inteligentă care ajută oamenii să lucreze mai ușor.
Bing este, de asemenea, unul dintre cele mai interesante instrumente AI din jur, iar caracteristicile sale vă permit să vă optimizați atât munca, cât și modul în care navigați pe internet.
Dar la începutul acestei săptămâni, Microsoft a dezvăluit și asta Orca 13B va deveni în curând open source. Orca 13B este un model AI mic, care funcționează la aceeași calitate și viteză ca și celelalte modele AI, cum ar fi ChatGPT.
Acum, în lupta dintre AI și cercetarea AI, Microsoft vine cu LongMem, un cadru ipotetic și un model de limbaj AI.
Conform acestui thread Reddit, LongMem permite o lungime nelimitată a contextului la un GPU redus și utilizarea memoriei CPU. Toate acestea se fac cu o viteză mai mare.
Este LongMem răspunsul Microsoft pentru o lungime nelimitată a contextului?
Ei bine, pentru a înțelege ce înseamnă a avea o lungime de context nelimitată, mai întâi trebuie să înțelegem ce înseamnă lungimea contextului?
Lungimea contextului se referă la numărul de jetoane (cuvinte, semne etc.) permise de un model, intrarea și ieșirea acestuia, precum și a dumneavoastră.
De exemplu, ChatGPT are un număr limitat de jetoane, ceea ce înseamnă că și lungimea contextului său este limitată. De îndată ce ChatGPT depășește această limită, atunci toată interacțiunea continuă pe care ai avut-o cu el până în acel moment își va pierde orice semnificație. Sau mai bine spus, se va reseta.
Deci, dacă începeți o conversație cu ChatGPT pe tema Windows și acea conversație durează mai mult decât contextul limitat lungime, atunci instrumentul AI va pierde contextul și fie va începe să se abată de la subiect, fie întreaga conversație va resetare.
O lungime nelimitată a contextului se va asigura că acest lucru nu se va întâmpla, iar modelul AI va continua să vă răspundă la subiect, în timp ce învăța și adaptează informațiile pe măsură ce îi vorbiți despre Windows.
Aceasta înseamnă că modelul AI va personaliza și conversația în funcție de intrarea dvs., de unde necesitatea ca contextul să aibă o lungime nelimitată.
Cum funcționează LongMem?
Microsoft promite tocmai asta cu noile lor cercetări asupra cadrului, LongMem. LongMem ar permite modelelor mari de limbaj să memoreze contexte pe termen lung și să utilizeze memoria pe termen lung la putere redusă a procesorului.
Cadrul constă dintr-un model de limbaj mare înghețat ca codificator de memorie, o rețea laterală reziduală ca dispozitiv de recuperare și cititor de memorie și o bancă de memorie în cache care stochează perechi cheie-valoare din trecut contexte.
În cercetările efectuate de Microsoft, experimentele arată că LongMem depășește liniile de bază în modelarea limbajului text lung, înțelegerea contextului lung și sarcinile de învățare în context cu memorie sporită. În plus, memoria pe termen lung îi permite să utilizeze mai multe exemple demonstrative pentru o învățare mai bună.
Și vestea bună este că LongMem va fi open-source. Deci, veți putea să-l studiați și să învățați cum să implementați cadrul în propriul dvs. model AI. Poti sa verifici profilul său GitHub aici.
Și dacă sunteți interesat să citiți întreaga lucrare de cercetare despre cadru, du-te aici și verifică.
Ce părere aveți despre această nouă descoperire tehnologică? Va revoluționa modul în care funcționează modelele AI? Asigurați-vă că ne spuneți mai jos gândurile și opiniile dvs.