Amazon Web Services (AWS) pasó todo el día luchando para que sus sistemas volvieran a estar en línea después de que una interrupción global masiva dejara fuera de servicio algunas de las plataformas más utilizadas del mundo, incluidas Snapchat, Venmo, Robinhood, Coinbase, Netflix e incluso varias aerolíneas y bancos.
Amazon explicó que el problema comenzó en lo profundo de una red interna de EC2, paralizando los servicios que dependen de su red troncal en la nube. Como Cryptopolitan Como se informó anteriormente , las interrupciones comenzaron temprano el lunes y siguieron extendiéndose, sin una solución inmediata a la vista.
El sitio de monitoreo Downdetector ha recibido más de 11 millones de informes de problemas de conectividad, que afectan a más de 2.500 empresas, hasta el momento de esta publicación.
Las empresas describieron una paralización total: los pagos fallaron, los portales de clientes se congelaron e incluso los sistemas de fábrica vinculados a la automatización basada en AWS quedaron en silencio.
Los expertos advirtieron que el daño financiero podría alcanzar cientos de miles de millones de dólares, dada la gran parte del comercio global que ahora se realiza a través de la infraestructura de Amazon.
Amazon confirma errores continuos mientras los ingenieros trabajan en EC2 y Lambda
En una serie de actualizaciones, Amazon informó a sus clientes que estaba observando la recuperación en todos los servicios de AWS, pero admitió que los usuarios aún podrían experimentar errores de funcionamiento intermitentes. La compañía afirmó que los lanzamientos de instancias estaban comenzando a funcionar correctamente de nuevo en varias zonas de disponibilidad de la región US-EAST-1, un centro crítico que alimenta gran parte de internet.
Amazon también detalló problemas dentro de su servicio de computación Lambda, explicando que algunos usuarios experimentaban errores temporales al realizar solicitudes de red. "Para corregir los errores de invocación de Lambda, redujimos la velocidad de sondeo de SQS", declaró la compañía. Los ingenieros volvieron a aumentar la velocidad de sondeo tras observar "más invocaciones exitosas y menos errores de función"
La compañía añadió que los fallos de lanzamiento de EC2 estaban disminuyendo gradualmente. «Nuestras medidas de mitigación para resolver los fallos de lanzamiento de las nuevas instancias de EC2 siguen avanzando», declaró Amazon, y añadió que Lambda@Edge, que gestiona las operaciones en la nube cerca de los usuarios finales, también mostraba una «mejora significativa»
Los expertos en seguridad actuaron rápidamente para calmar las especulaciones sobre un ciberataque. Bryson Bort, director ejecutivo de Scythe, declaró a Al Jazeera que la situación no se debía a piratería ni espionaje.
“Siempre que vemos estos titulares, la gente piensa que se trata de un ciberataque”, dijo Bryson. “Y en este caso, no lo es. La mayoría de las veces no lo es. Suele ser un error humano”
Los defensores de los derechos digitales advierten sobre la peligrosa dependencia excesiva de los gigantes de la nube
La interrupción del servicio de internet desencadenó un debate más amplio sobre la fragilidad de internet y la concentración de poder en manos de unos pocos gigantes tecnológicos. La organización de derechos digitales Artículo 19 calificó el colapso de AWS como un "fracaso democrático"
La directora de asuntos digitales de Amazon, Corinne Cath-Speth, advirtió que el mundo necesita diversificar la computación en la nube para evitar colapsos similares. «La infraestructura que sustenta el discurso democrático, el periodismodent y las comunicaciones seguras no puede depender de unas pocas empresas», afirmó.
La magnitud del impacto financiero aún se está calculando, pero CNN informó que podría alcanzar fácilmente los cientos de miles de millones de dólares, citando a Mehdi Daoudi, director ejecutivo de Catchpoint, una empresa de trac
“Eldent pone de relieve la complejidad y la fragilidad de internet”, declaró Mehdi. “El impacto financiero alcanzará fácilmente cientos de miles de millones debido a la pérdida de productividad de millones de trabajadores que no pueden realizar su trabajo, además de la interrupción o el retraso de operaciones comerciales, desde aerolíneas hasta fábricas”
A última hora del lunes, Amazon anunció que las labores de recuperación estaban avanzando, aunque muchas empresas seguían teniendo dificultades. Plataformas como Snapchat, Venmo y Coinbase seguían reportando ralentizaciones e interrupciones.
Para gran parte del mundo conectado, la interrupción sirvió como un duro recordatorio de hasta qué punto todo (desde el comercio de criptomonedas hasta la logística global) depende de que unos pocos centros de datos de Amazon mantengan las luces encendidas.

