AWS confirmó el martes por la tarde que su infraestructura en la nube se había recuperado por completo después de que una interrupción global masiva congelara aplicaciones, servicios y empresas durante más de 10 horas.
La interrupción, que comenzó más temprano ese día, desconectó a usuarios desde Tokio hasta Londres, dejando a la gente sin acceso a Snapchat, Reddit, Venmo y Zoom y paralizando las operaciones de miles de empresas.
Este fue el mayor fallo de Internet desde el colapso de CrowdStrike hace aproximadamente un año.
Según Reuters, la plataforma en la nube dijo que todo estaba estable nuevamente a las 3 p.m., hora del Pacífico, aunque algunos servicios todavía estaban funcionando a pesar de recibir mensajes atrasados.
AWS, la columna vertebral de Internet para innumerables empresas, admitió que el problema se originó debido a un monitor de estado de red dañado dentro de su red interna EC2, una parte clave del servicio Elastic Compute Cloud.
Se supone que ese sistema en la nube gestiona el equilibrio del tráfico entre los servidores, pero en lugar de ello, falló y dejó sin acceso a DynamoDB, la base de datos en la nube que gestiona los datos de usuario de muchas aplicaciones. La causa principal se relacionó con problemas de resolución de DNS, que básicamente impedían que las aplicaciones encontraran las direcciones correctas para acceder a esa base de datos.
La interrupción afectó la región US-EAST-1 de AWS, que, por cierto, es su zona de nube más grande y antigua.
Ese centro de datos específico con sede en Virginia ahora ha sido culpado por tres importantes caídas de Internet en solo cinco años, incluidas las de 2020 y 2021. Amazon no dijo por qué ese mismo clúster sigue fallando, a pesar de que sigue siendo la región predeterminada para muchos usuarios.
AWS derriba aplicaciones, bancos y aerolíneas en todo el mundo
Venmo, Zoom y cientos de otros servicios seguían fallando horas después de que AWS anunciara que todo había vuelto a la normalidad. En Gran Bretaña, importantes instituciones como Lloyds Bank, Bank of Scotland y Vodafone se vieron afectadas. Incluso la autoridad fiscal del país, HMRC, se desconectó. Más de 4 millones de usuarios reportaron interrupciones, según Downdetector.
Las aplicaciones de juegos se vieron afectadas, como Fortnite, Clash Royale y Clash of Clans, que dejaron de funcionar. Plataformas de criptomonedas como Coinbase y Robinhood también se desconectaron. La startup de inteligencia artificial Perplexity confirmó que no pudo mantener sus servicios operativos durante la interrupción. Prime Video, Alexa y su principal sitio web de compras de Amazon también se cayeron.
Mientras tanto, Meredith Whittaker,dent de Signal, publicó en X que la aplicación de chat seguro había dejado de funcionar. Elon Musk, propietario de X, afirmó que su plataforma seguía activa.
AWS lidera el mercado global de la nube, por delante de Microsoft Azure y Google Cloud, pero ha demostrado una vez más lo frágil que puede ser ese dominio. Si falla un monitor, el mundo entero lo siente.
Ken Birman, profesor de informática en la Universidad de Cornell, afirmó que los desarrolladores deben dejar de recortar gastos. "Cuando las personas recortan gastos y recortan gastos para intentar lanzar una aplicación, y luego olvidan que se saltaron ese último paso y no se protegieron realmente contra una interrupción, esas empresas son las que realmente deberían ser examinadas posteriormente", declaró a Reuters. Añadió que AWS ya ofrece herramientas para proteger las aplicaciones, pero las empresas a menudo las ignoran.
Jake Moore, asesor de ciberseguridad de ESET, afirmó que la interrupción del servicio demostró el problema de confiar todo en unos pocos proveedores de la nube. Nishanth Sastry, jefe de investigación del Departamento de Informática de la Universidad de Surrey, explicó que el error que cometen muchas empresas es confiar en un solo proveedor. Las empresas necesitan redundancia, no lealtad ciega.
Ryan Griffin, líder de prácticas cibernéticas en McGill and Partners, afirmó que el costo del tiempo de inactividad no se limita a la frustración del usuario. "Para las grandes empresas, horas de inactividad en la nube se traducen en millones en pérdidas de productividad e ingresos", afirmó.
A pesar de toda la disrupción, Wall Street se encogió de hombros. Las acciones de Amazon subieron un 1,6%, a punto de cerrar el día en 220 dólares, su máximo en tres meses.

