Po večkratnem Spremembe Azure in varnostne izboljšave v zadnjih nekaj mesecih Microsoft uvaja Project Tardigrade kot svoj najnovejši poskus, da Azure postane bolj zanesljiv.
Project Tardigrade preprečuje okvare platforme
Project Tardigrade je nova storitev, katere cilj je izboljšati odpornost Azure. Vključuje strategije za ublažitev, ki Azure VM zaščitijo pred napakami platforme.
Evo, kako Mark Russinovich,Direktor tehnologije v podjetju Microsoft Azure, je opisovanje trenutno delo na Azure:
Naš cilj je organizacijam omogočiti zanesljivo izvajanje delovnih obremenitev v Azureju. S tem kot našim vodilnim načelom neprestano vlagamo v razvoj platforme Azure, ki naj bi postala odporen na napake, ne samo za povečanje poslovne produktivnosti, temveč tudi za zagotavljanje brezhibne stranke izkušnje.
Da bi preprečili vpliv na vaše delovne obremenitve, storitev komponentam omogoča samozdravljenje in hitro okrevanje po morebitnih okvarah, tudi v kritičnih napakah gostitelja.
Kako deluje projekt Tardigrade?
Tukaj je primer o tem, kako poteka potek dela za obnovitev Tardigrade:
- Faza 1: Ta korak ne vpliva na izvajanje VM strank. Preprosto reciklira vse storitve, ki se izvajajo na gostitelju. V redkih primerih, ko se storitev z napako ne znova zažene, nadaljujemo s fazo 2.
- 2. faza: Naša diagnostična služba deluje na gostitelju, da sistematično zbira vse ustrezne dnevnike / odlagališča, da lahko natančno diagnosticiramo razlog za okvaro v 1. fazi. Ta izčrpna analiza nam omogoča, da težavo „povzročimo“ in s tem preprečimo ponovitve v prihodnosti.
- Faza 3: Na visoki ravni smo sistem ponastavili v zdravo stanje z minimalnim vplivom na kupca, da bi ublažili težavo gostitelja. V tej fazi ohranimo stanja vsake VM v RAM-u, nato pa začnemo ponastaviti OS v zdravo stanje. Medtem ko se OS hitro ponastavi spodaj, se zagnani programi na vseh VM-jih, ki jih gosti strežnik, na kratko "zamrznejo", saj je CPU začasno zaustavljen. Ta izkušnja je podobna omrežni povezavi, ki je bila začasno izgubljena, vendar se je zaradi logike ponovnega poskusa hitro nadaljevala. Ko je OS uspešno ponastavljen, VM porabijo shranjeno stanje in nadaljujejo z normalno dejavnostjo, s čimer se izognejo morebitnim ponovnim zagonom VM.
S tem v mislih bo projekt Tardigrade to zagotovil okvara katere koli posamezne komponente v gostitelju ne vpliva na celoten sistem. Tako napake gostitelja ne bodo vplivale na VM kupcev.
Microsoft si močno prizadeva izboljšati in razširiti različne scenarije odpovedi gostitelja, da se prepričate, da je njihova platforma za računalništvo v oblaku bolj zanesljiva kot kdaj koli prej.
V bližnji prihodnosti pričakujte nov razvoj in druge izvedbe zanesljivosti.