A Amazon Web Services (AWS) passou o dia inteiro lutando para restabelecer seus sistemas após uma enorme interrupção global que afetou algumas das plataformas mais usadas no mundo, incluindo Snapchat, Venmo, Robinhood, Coinbase, Netflix e até mesmo diversas companhias aéreas e bancos.
A Amazon explicou que o problema começou em uma camada profunda da rede interna do EC2, paralisando serviços que dependem de sua infraestrutura de nuvem. Como relatado pela Cryptopolitan Conforme relatado anteriormente , as interrupções começaram na manhã de segunda-feira e continuaram se espalhando, sem nenhuma solução imediata à vista.
Até o momento da publicação desta notícia, o site de monitoramento Downdetector recebeu mais de 11 milhões de relatos de problemas de conectividade, afetando mais de 2.500 empresas.
As empresas descreveram uma paralisação total; os pagamentos falharam, os portais dos clientes congelaram e até mesmo os sistemas de fábrica ligados à automação baseada na AWS ficaram inoperantes.
Especialistas alertaram que os prejuízos financeiros poderiam chegar a centenas de bilhões de dólares, considerando a parcela do comércio global que agora passa pela infraestrutura da Amazon.
A Amazon confirma erros contínuos enquanto os engenheiros trabalham no EC2 e no Lambda
Em uma série de atualizações, a Amazon informou aos clientes que estava "observando a recuperação em todos os serviços da AWS", mas admitiu que os usuários ainda poderiam enfrentar "erros intermitentes de funcionamento". A empresa afirmou que as inicializações de instâncias estavam começando a ser bem-sucedidas novamente em várias Zonas de Disponibilidade na região US-EAST-1, um hub crítico que alimenta grande parte da internet.
A Amazon também detalhou problemas em seu serviço de computação Lambda, explicando que alguns usuários estavam enfrentando erros temporários ao fazer requisições de rede. "Para corrigir os erros de invocação do Lambda, reduzimos a taxa de polling do SQS", afirmou a empresa. Os engenheiros agora estão aumentando a taxa de polling novamente após observarem "mais invocações bem-sucedidas e menos erros de função"
A empresa acrescentou que as falhas de inicialização do EC2 estavam diminuindo gradualmente. "Nossas medidas para resolver as falhas de inicialização de novas instâncias do EC2 continuam progredindo", disse a Amazon, acrescentando que o Lambda@Edge, que lida com as operações em nuvem próximas aos usuários finais, também estava apresentando "melhorias significativas"
Especialistas em segurança agiram rapidamente para acalmar as especulações sobre um possível ataque cibernético. Bryson Bort, CEO da Scythe, declarou à Al Jazeera que a situação não foi resultado de invasão ou espionagem.
“Sempre que vemos essas manchetes, as pessoas pensam que é um ataque cibernético”, disse Bryson. “E neste caso, não é. Na maioria das vezes não é. Geralmente é erro humano.”
Defensores dos direitos digitais alertam para a perigosa dependência excessiva das gigantes da computação em nuvem
A interrupção da internet desencadeou um debate mais amplo sobre a fragilidade da internet e a concentração de poder nas mãos de algumas gigantes da tecnologia. A organização de direitos digitais Article 19 classificou o colapso da AWS como uma “falha democrática”
A chefe de assuntos digitais da Amazon, Corinne Cath-Speth, alertou que o mundo precisa de diversificação na computação em nuvem para evitar colapsos semelhantes. "A infraestrutura que sustenta o discurso democrático, o jornalismodent e as comunicações seguras não pode depender de um punhado de empresas", afirmou.
A dimensão do impacto financeiro ainda está sendo calculada, mas a CNN informou que ele pode facilmente chegar às centenas de bilhões de dólares, citando Mehdi Daoudi, CEO da Catchpoint, uma empresa de trac
“Odent destaca a complexidade e a fragilidade da internet”, disse Mehdi. “O impacto financeiro chegará facilmente a centenas de bilhões devido às perdas de produtividade de milhões de trabalhadores que não podem exercer suas funções, além das operações comerciais que são interrompidas ou atrasadas — de companhias aéreas a fábricas.”
No final da segunda-feira, a Amazon afirmou que os esforços de recuperação estavam progredindo, embora muitas empresas continuassem a enfrentar dificuldades. Plataformas como Snapchat, Venmo e Coinbase ainda relatavam lentidão e interrupções.
Para grande parte do mundo conectado, a interrupção serviu como um duro lembrete de quão profundamente tudo (da negociação de criptomoedas à logística global) depende de alguns poucos data centers da Amazon para manter as operações em funcionamento.

