Project Tardigrade protege sus máquinas virtuales contra fallas del host

Project Tardigrade protege sus máquinas virtuales contra fallas de la plataforma

Después de múltiples Cambios en Azure y mejoras de seguridad En los últimos meses, Microsoft ha presentado Project Tardigrade como su nuevo intento de hacer que Azure sea más confiable.

Project Tardigrade evita fallas en la plataforma

Project Tardigrade es un nuevo servicio que tiene como objetivo mejorar la resistencia de Azure. Incluye estrategias de mitigación que protegen las máquinas virtuales de Azure contra fallas de la plataforma.

Así es como Mark Russinovich,Director de tecnología de Microsoft Azure, es describiendo el trabajo actual en Azure:

Nuestro objetivo es capacitar a las organizaciones para que ejecuten sus cargas de trabajo de manera confiable en Azure. Con esto como nuestro principio rector, invertimos continuamente en la evolución de la plataforma Azure para convertirnos Resistente a fallos, no solo para impulsar la productividad empresarial, sino también para proporcionar un cliente sin problemas. experiencia.

Para evitar el impacto en sus cargas de trabajo, el servicio

permite que los componentes se reparen automáticamente y se recuperen rápidamente de posibles fallas, incluso en fallas críticas del host.

¿Cómo funciona Project Tardigrade?

Aquí está un ejemplo sobre cómo funciona el flujo de trabajo de recuperación tardígrado:

  • Fase 1: este paso no tiene ningún impacto en la ejecución de las máquinas virtuales de los clientes. Simplemente recicla todos los servicios que se ejecutan en el host. En el raro caso de que el servicio defectuoso no se reinicie correctamente, procedemos a la Fase 2.
  • Fase 2: Nuestro servicio de diagnóstico se ejecuta en el host para recopilar todos los registros / volcados relevantes de forma sistemática, para garantizar que podamos diagnosticar a fondo el motivo de la falla en la Fase 1. Este análisis exhaustivo nos permite "raíz" del problema y, por lo tanto, evitar que vuelva a ocurrir en el futuro.
  • Fase 3: A un alto nivel, restablecemos el sistema operativo a un estado saludable con un impacto mínimo en el cliente para mitigar el problema del host. Durante esta fase, conservamos los estados de cada VM en la RAM, después de lo cual comenzamos a restablecer el sistema operativo a un estado saludable. Mientras que el sistema operativo se reinicia rápidamente por debajo, la ejecución de aplicaciones en todas las máquinas virtuales alojadas en el servidor se "congela" brevemente cuando la CPU se suspende temporalmente. Esta experiencia es similar a una conexión de red que se pierde temporalmente pero que se reanuda rápidamente debido a la lógica de reintento. Una vez que el sistema operativo se restablece correctamente, las máquinas virtuales consumen su estado almacenado y reanudan la actividad normal, evitando así cualquier posible reinicio de la máquina virtual.

Con esto en mente, Project Tardigrade se asegurará de que la falla de cualquier componente en el host no afecta a todo el sistema. Como tal, las VM de los clientes no se verán afectadas por fallas del host.

Microsoft está trabajando duro para mejorar y expandir el diferentes escenarios de falla de host para asegurarse de que su plataforma de computación en la nube sea más confiable que nunca.

Espere nuevos desarrollos y otras implementaciones de confiabilidad en el futuro cercano.

Los hosts dedicados de Azure le permiten colocar máquinas virtuales de Azure en servidores dedicados

Los hosts dedicados de Azure le permiten colocar máquinas virtuales de Azure en servidores dedicadosMicrosoft Azul

Azure de Microsoft pasó por muchos cambios últimamente. Entre los Adquisición de BlueTalon y el Centro de seguridad de Azure para Iot, no ha habido mucho espacio para respirar.Azure Dedicated Host ...

Lee mas
Azure Blob Storage para comenzar a usar el protocolo NFS 3.0

Azure Blob Storage para comenzar a usar el protocolo NFS 3.0Microsoft Azul

Microsoft lanzó en versión preliminar pública la compatibilidad con NFS 3.0 para Azure Blob Storage.NFS 3.0 admite la implementación de cargas de trabajo de acceso secuencial de gran escala y lectu...

Lee mas
Azure y CyberX para impulsar la visibilidad de los activos de IoT de las empresas

Azure y CyberX para impulsar la visibilidad de los activos de IoT de las empresasIotMicrosoft Azul

Microsoft reveló hoy su adquisición planificada de la firma de ciberseguridad CyberX.La compañía tiene la intención de integrar CyberX con varios servicios de Azure para mejorar la seguridad de Int...

Lee mas