Amazon falou sobre as razões para a falha de serviços em nuvem

A Amazon disse que a falha massiva de sua infraestrutura em nuvem foi causada pela falha de ferramentas projetadas para automatizar processos. O acidente afetou muitas empresas e serviços, desde parques de diversões da Disney e streaming da Netflix até aspiradores de pó robóticos e vendas online de ingressos para shows.

Fonte da imagem: Bethany Drouin / pixabay.com

Em nota divulgada na véspera, a empresa informou que o problema surgiu no dia 7 de dezembro, quando um dos programas destinados a melhorar a confiabilidade da rede parou de funcionar, causando comportamento imprevisível de “um grande número” de sistemas. Isso levou a um aumento na atividade na infraestrutura da Amazon e os usuários perderam o acesso a alguns recursos da nuvem. “O efeito bola de neve causou um código incorreto que foi executado automaticamente. O problema original era o desligamento dos controles internos e sistemas de monitoramento ”, comentou o analista da Forrester Brent Ellis no comunicado.

Os problemas começaram em 7 de dezembro por volta das 10h30 no horário de Nova York (18h30 no horário de Moscou), e os especialistas da empresa demoraram várias horas para resolvê-los. Houve inúmeras reclamações nas redes sociais de que os sistemas domésticos inteligentes e outros dispositivos conectados à Internet pararam de funcionar. Alguns especialistas consideraram a explicação da empresa insuficiente. “Eles não explicam o que era esse comportamento imprevisível porque não sabiam o que era. Eles estavam tentando consertá-lo aleatoriamente, e é por isso que demorou tanto ”, disse Corey Quinn, especialista em nuvem do Duckbill Group.

No geral, o serviço AWS é altamente confiável. A última vez que uma falha dessa magnitude foi observada foi em 2017, quando um funcionário da empresa desligou acidentalmente mais servidores do que o necessário ao consertar um sistema de faturamento. No entanto, um incidente nesta semana lembrou quantos produtos e serviços dependem de centros de dados centralizados operados por um pequeno número de gigantes da tecnologia, incluindo Amazon, Microsoft e Google.

E não existe uma solução simples para o problema. Alguns especialistas dizem que as empresas devem duplicar serviços nas infraestruturas de vários provedores, outros apontam que tal estratégia é impraticável e que ocorrerão falhas quando cada um dos provedores de nuvem falhar, não apenas a Amazon. “Sabemos que o incidente teve um impacto significativo em muitos clientes. Faremos o nosso melhor para aprender com ele e usá-lo para melhorar nossa disponibilidade no futuro ”, disse a empresa em um comunicado.

avalanche

Postagens recentes

O CEO da Apple nomeia John Ternus como chefe de design.

O CEO da Apple, Tim Cook, nomeou discretamente John Ternus, vice-presidente sênior de engenharia de…

2 horas atrás

A Apple quase alcançou a AMD em participação de mercado de chips para laptops – e isso em apenas cinco anos.

A Apple fez progressos significativos no mercado de laptops com seus processadores Apple Silicon em…

2 horas atrás

Elon Musk anunciou que os robôs humanoides Optimus estarão à venda no final do próximo ano.

Elon Musk, que se esforça para ser o primeiro a garantir nichos de mercado promissores,…

3 horas atrás

“A Nintendo finalmente liberou a Game Freak das minas de Pokémon”: Novas imagens de jogabilidade do jogo de ação Beast of Reincarnation impressionaram os fãs de Pokémon.

Conforme prometido, os desenvolvedores do estúdio japonês Game Freak (da série Pokémon) compartilharam novas imagens…

8 horas atrás

Fable receberá um criador de personagens e será lançado neste outono para PC, Xbox e PS5.

A desenvolvedora britânica Playground Games revelou uma série de novas informações sobre seu ambicioso RPG…

9 horas atrás