Többszörös után Azure-változások és biztonsági fejlesztések az elmúlt néhány hónapban a Microsoft bemutatja a Project Tardigrade programot, mint legújabb kísérletet az Azure megbízhatóságának növelésére.
A Tardigrade projekt megakadályozza a platform meghibásodásait
A Project Tardigrade egy új szolgáltatás, amelynek célja az Azure rugalmasságának javítása. Ez magában foglalja az enyhítési stratégiákat, amelyek megvédik az Azure virtuális gépeket a platformhibákkal szemben.
Íme, hogy Mark Russinovich,A Microsoft Azure technológiai vezérigazgatója leíró a jelenlegi munka az Azure-on:
Célunk, hogy felhatalmazzuk a szervezeteket a munkaterhelések megbízható futtatására az Azure-on. Ezzel vezérelvként folyamatosan fektetünk be az Azure platform fejlesztésébe hibatűrő, nemcsak az üzleti termelékenység növelése érdekében, hanem a zökkenőmentes ügyfél biztosítása érdekében is tapasztalat.
A munkaterhelésre gyakorolt hatás megelőzése érdekében a szolgáltatás lehetővé teszi az alkatrészek öngyógyulását és a potenciális kudarcok gyors felépülését, még kritikus gazdahibák esetén is.
Hogyan működik a Project Tardigrade?
Itt van egy példa a Tardigrade helyreállítási munkafolyamatának működéséről:
- 1. fázis: Ez a lépés nincs hatással az ügyfél virtuális gépek futtatására. Egyszerűen újrahasznosítja a gazdagépen futó összes szolgáltatást. Azon ritka esetekben, amikor a hibás szolgáltatás nem indul újra sikeresen, folytatjuk a 2. fázist.
- 2. fázis: Diagnosztikai szolgáltatásunk a gazdagépen fut, hogy szisztematikusan összegyűjtse az összes releváns naplót / kiírást annak biztosítása érdekében, hogy alaposan diagnosztizálhassuk a hiba okát az 1. szakaszban. Ez az átfogó elemzés lehetővé teszi számunkra a probléma „kiváltó okát” és ezáltal a jövőbeni újbóli előfordulás megelőzését.
- 3. fázis: Magas szinten visszaállítjuk az operációs rendszert egy egészséges állapotba, minimális vásárlói hatással, hogy enyhítsük a gazdagép problémáját. Ebben a szakaszban minden virtuális gép állapotát megőrzzük RAM-ra, ezután kezdjük visszaállítani az operációs rendszert egészséges állapotba. Míg az operációs rendszer gyorsan alaphelyzetbe áll alatta, a szerveren tárolt összes virtuális gépen futó alkalmazások rövid ideig „lefagynak”, mivel a CPU átmenetileg fel van függesztve. Ez a tapasztalat hasonló az ideiglenesen megszakadt hálózati kapcsolathoz, de az újrapróbálkozási logika miatt gyorsan folytatódik. Az operációs rendszer sikeres visszaállítása után a virtuális gépek elfogyasztják tárolt állapotukat, és folytatják a normál tevékenységet, megkerülve ezzel az esetleges virtuális gép újraindítását.
Ezt szem előtt tartva a Project Tardigrade biztosítja ezt a gazdagép egyetlen összetevőjének meghibásodása nem érinti az egész rendszert. Mint ilyen, az ügyfél virtuális gépeit nem érintik a gazdagép hibái.
A Microsoft keményen dolgozik a különböző gazdagép-meghibásodási szcenáriókat, hogy megbizonyosodjon arról, hogy felhőalapú számítási platformja megbízhatóbb, mint valaha.
Új fejlesztésekre és egyéb megbízhatósági megvalósításokra lehet számítani a közeljövőben.