بعد عدة تغييرات Azure و تحسينات أمنية في الشهرين الماضيين ، تقدم Microsoft مشروع Tardigrade كأحدث محاولة لجعل Azure أكثر موثوقية.
يمنع مشروع Tardigrade فشل النظام الأساسي
Project Tardigrade هي خدمة جديدة تهدف إلى تحسين مرونة Azure. يتضمن استراتيجيات التخفيف التي تحمي Azure VMs من فشل النظام الأساسي.
وإليك كيفية عمل مارك روسينوفيتش ،كبير مسؤولي التكنولوجيا في Microsoft Azure ، هو وصف العمل الحالي على Azure:
هدفنا هو تمكين المؤسسات من تشغيل أعباء العمل بشكل موثوق على Azure. نظرًا لأن هذا هو مبدأنا التوجيهي ، فإننا نستثمر باستمرار في تطوير منصة Azure لتصبح مقاومة الأخطاء ، ليس فقط لتعزيز إنتاجية الأعمال ولكن أيضًا لتوفير عميل سلس خبرة.
لمنع التأثير على أعباء العمل الخاصة بك ، الخدمة تمكن المكونات من الشفاء الذاتي والتعافي بسرعة من حالات الفشل المحتملة ، حتى في أخطاء المضيف الحرجة.
كيف يعمل مشروع Tardigrade؟
هنا مثال حول كيفية عمل سير عمل استعادة Tardigrade:
- المرحلة 1: هذه الخطوة ليس لها أي تأثير على تشغيل الأجهزة الافتراضية للعملاء. يقوم ببساطة بإعادة تدوير جميع الخدمات التي تعمل على المضيف. في الحالة النادرة التي لا يتم فيها إعادة تشغيل الخدمة المعيبة بنجاح ، ننتقل إلى المرحلة 2.
- المرحلة 2: تعمل خدمة التشخيص الخاصة بنا على المضيف لجمع جميع السجلات / عمليات التفريغ ذات الصلة بشكل منهجي ، للتأكد من أنه يمكننا التشخيص الدقيق لسبب الفشل في المرحلة الأولى. يتيح لنا هذا التحليل الشامل "السبب الجذري" للمشكلة وبالتالي منع تكرارها في المستقبل.
- المرحلة 3: على مستوى عالٍ ، نقوم بإعادة تعيين نظام التشغيل إلى حالة صحية مع الحد الأدنى من التأثير على العميل للتخفيف من مشكلة المضيف. خلال هذه المرحلة ، نحافظ على حالات كل جهاز افتراضي إلى ذاكرة الوصول العشوائي ، وبعد ذلك نبدأ في إعادة تعيين نظام التشغيل إلى حالة صحية. أثناء إعادة تعيين نظام التشغيل تحته بسرعة ، يتم "تجميد" التطبيقات قيد التشغيل على جميع الأجهزة الظاهرية المستضافة على الخادم لفترة وجيزة حيث يتم تعليق وحدة المعالجة المركزية مؤقتًا. تشبه هذه التجربة اتصال الشبكة الذي تم فقده مؤقتًا ولكن تم استئنافه بسرعة بسبب إعادة محاولة المنطق. بعد إعادة تعيين نظام التشغيل بنجاح ، تستهلك الأجهزة الافتراضية حالتها المخزنة وتستأنف النشاط الطبيعي ، وبالتالي تتجنب أي عمليات إعادة تشغيل محتملة لجهاز VM.
مع وضع ذلك في الاعتبار ، سيضمن مشروع Tardigrade ذلك لا يؤثر فشل أي مكون فردي في المضيف على النظام بأكمله. على هذا النحو ، لن تتأثر الأجهزة الافتراضية للعملاء بأخطاء المضيف.
تعمل Microsoft جاهدة لتحسين وتوسيع نطاق سيناريوهات مختلفة لفشل المضيف للتأكد من أن نظام الحوسبة السحابية الخاص بهم أكثر موثوقية من أي وقت مضى.
توقع تطورات جديدة وتطبيقات موثوقية أخرى في المستقبل القريب.