La interrupción del servicio de Microsoft Azure muestra la dura realidad de los fallos en la nube.

La plataforma en la nube Azure de Microsoft , sus servicios de Microsoft 365 , Xbox y Minecraft comenzaron a sufrir interrupciones alrededor del mediodía (hora del este) del miércoles, como resultado de lo que Microsoft describió como “un cambio de configuración involuntario”. El incidente, que representa la segunda interrupción importante de un proveedor de servicios en la nube en menos de dos semanas, pone de manifiesto la inestabilidad de una internet construida en gran medida sobre una infraestructura gestionada por unos pocos gigantes tecnológicos.
Los problemas de Microsoft se originaron específicamente en la red de distribución de contenido Front Door de Azure y surgieron apenas unas horas antes del anuncio de resultados previsto por la compañía. El sitio web de la empresa, incluida su página de relaciones con los inversores, seguía inactivo el miércoles por la tarde, y la página de estado de Azure , donde Microsoft publica actualizaciones, también presentaba problemas intermitentes.
Microsoft informó el miércoles, mediante actualizaciones de estado, que llevó a cabo un proceso de reversión secuencial de las versiones recientes de su entorno hasta identificar la última configuración estable conocida. A las 15:01 ET, la compañía anunció que había identificado e implementado esta configuración estable y que "los clientes podrían empezar a observar los primeros indicios de recuperación. Actualmente estamos recuperando nodos y redirigiendo el tráfico a través de nodos en buen estado".
Un portavoz de Microsoft declaró: «Estamos trabajando para solucionar un problema que afecta a Azure Front Door y que repercute en la disponibilidad de algunos servicios. Los clientes deben seguir consultando sus alertas de estado del servicio». La compañía no respondió de inmediato a las preguntas de WIRED sobre la naturaleza del cambio de configuración que provocó la interrupción.
Además de coincidir con el día de la presentación de resultados de Microsoft, la interrupción se produce nueve días después de que Amazon Web Services, rival de Azure, sufriera una interrupción masiva que afectó a sitios y servicios en todo el mundo. Los principales proveedores de servicios en la nube, a menudo denominados «hiperescaladores», estandarizan y suelen mejorar la seguridad y la fiabilidad básicas para sus clientes, pero los problemas y las interrupciones pueden convertirlos en puntos únicos de fallo para grandes cantidades de servicios digitales críticos.
“Incluso la página de estado de interrupciones de Azure está caída”, afirma Davi Ottenheimer, gerente de operaciones y cumplimiento de seguridad con amplia experiencia y vicepresidente de la empresa de infraestructura de datos Inrupt. “Otro error de cambio de configuración; vivimos en la era de las brechas de integridad más que nunca”.
Azure impidió que sus clientes realizaran cambios de configuración en sus instancias mientras trabajaba para solucionar el problema. La compañía informó en una actualización de estado a las 15:22 ET que espera que la situación esté completamente resuelta para las 19:20 ET.
“Las organizaciones pueden creer que están protegidas por su elección de proveedor de nube, pero las dependencias son más profundas”, afirma Munish Walther-Puri, profesor adjunto de IANS Research y exdirector de ciberseguridad de la ciudad de Nueva York. “Cuando los socios clave dependen de otros hiperescaladores, la exposición se multiplica. A medida que la IA se convierte en la siguiente capa de infraestructura crítica, estas interrupciones demuestran la fragilidad de nuestra red troncal digital”.
wired




