phi-1 هو نموذج لغة Microsoft الجديد للترميز.
- تمول Microsoft الكثير من أبحاث الذكاء الاصطناعي.
- بعد الإعلان عن أن Orca سيكون مفتوح المصدر ، يتوفر phi-1 هنا أيضًا.
- phi-1 قادر على توحيد المعرفة من تلقاء نفسه.
تخطو Microsoft حقًا خطوة كبيرة في تطوير الذكاء الاصطناعي. في الشهر الماضي ، كان الذكاء الاصطناعي في طليعة مؤتمر Microsoft Build ، وقد أعلنت التكنولوجيا التي تتخذ من ريدموند مقراً لها عن ذلك مساعد الطيار قادم إلى نظام التشغيل Windows 11. كتطبيق مدمج أصلي ، لكل ما تحتاجه ،
الذكاء الاصطناعي قادم إلى Microsoft Teams أيضًا ، في أداة Recap Ai الخاصة به. وستستخدم الكثير من الأدوات الأخرى من Microsoft الذكاء الاصطناعي ، بما في ذلك Microsoft Fabric.
ولكن يبدو أن Microsoft تمول أيضًا أبحاث الذكاء الاصطناعي. أعلن عملاق التكنولوجيا مؤخرًا سيكون Orca 13B مفتوح المصدر. و LongMem هي نقطة جيدة أخرى في أبحاث الذكاء الاصطناعي: إنها الإجابة عن طول السياق غير المحدود.
والآن هناك وقت لاختراق كبير آخر في أبحاث الذكاء الاصطناعي ، قادم من Microsoft بالطبع. يُقال إن نموذج الترميز LLM 1.3B الجديد ، المسمى phi-1 ، يتفوق على GPT 3.5 ، في 4 أيام فقط من التدريب.
ما هو phi-1 وكيف يتفوق على GPT بالفعل؟
فاي -1 هو نموذج لغة جديد 1.3B-معلمة للتعليمات البرمجية، بحجم أصغر بكثير من النماذج المنافسة. تم تدريب نموذج اللغة لمدة 4 أيام ، أكثر من 7B توكينز (أكثر بقليل من 50B من إجمالي الرموز المرئية) متبوعًا بضبط دقيق على أقل من 200 مليون من الرموز المميزة.
على الرغم من كونه أصغر بكثير من الموديلات المنافسة ، بلغ معدل phi-1 50.6٪ [بريد إلكتروني محمي] دقة على HumanEval و 55.5٪ [بريد إلكتروني محمي] الدقة في MBPP (برامج Python الأساسية في الغالب) ، والتي تعد واحدة من أفضل الأرقام المبلغ عنها ذاتيًا باستخدام جيل LLM واحد فقط.
علاوة على ذلك ، على الرغم من تدريبه على عدد أقل بكثير من الرموز المميزة مقارنة بالنماذج الحالية ، لا يزال لدى phi-1 الكثير من الإمكانات.
التحسينات على HumanEval هي أعظم إنجازات phi-1 ، كنموذج لغوي. بعد الضبط ، تمكنت phi-1 من تنفيذ المهام التي لم تكن واردة في مجموعة بيانات الضبط النهائي. هذا يعني أن النموذج قد تكيف وحسّن عملية الضبط الدقيق.
والشيء الأكثر روعة هو أن phi-1 أعاد تنظيم وتعزيز المعرفة المكتسبة أثناء التدريب ، على الرغم من أن المعرفة لم تكن موجودة هناك بشكل صريح في المقام الأول.
بكلمات أقصر ، لا يتعلم phi-1 أثناء التدريب فحسب ، بل يوسع المعرفة أيضًا من تلقاء نفسه. تمكنت من التفوق في الأداء على GPT 3.5 على كل المستويات ، وهي مسألة وقت فقط حتى يتغلب النموذج الصغير على النماذج الكبيرة ، مثل GPT 4.
ما رأيك في نموذج الذكاء الاصطناعي الجديد هذا؟ إلى أين تتجه أبحاث الذكاء الاصطناعي برأيك؟ تأكد من إخبارنا بآرائك في قسم التعليقات أدناه.