O Google Cloud conseguiu quebrar sua própria infraestrutura de rede, mas se corrigiu rapidamente

Faz apenas uma semana que o Google excluiu a conta na nuvem do fundo de aposentadoria australiano UniSuper, mas parece que os engenheiros da empresa estão apenas pegando o jeito. De acordo com o The Register, o Google Cloud interrompeu dezenas de serviços na última sexta-feira.

Inicialmente, o Google Cloud anunciou o lançamento de “automação de manutenção para desativar componentes de controle de rede não utilizados em um único local”. Mas, como resultado, a interrupção ocorreu em 40 locais ao mesmo tempo, de modo que, durante quase três horas, os usuários de 33 serviços do Google Cloud, incluindo grandes serviços como Compute Engine e Kubernetes Engine, enfrentaram uma série de problemas:

  • Novas instâncias não tinham conexão de rede;
  • Máquinas virtuais migradas/reiniciadas perderam conectividade de rede;
  • As configurações das redes virtuais (firewalls, etc.) não puderam ser atualizadas;
  • Perda parcial de pacotes para fluxos de rede VPC (Virtual Private Cloud) individuais nas regiões us-central1 e us-east1;
  • Incapacidade de alocar portas (DPA) no Cloud NAT;
  • Falha ao criar novos nós e pools do GKE (Google Kubernetes Engine).

Outros serviços que exigiam o uso de máquinas virtuais no Google Cloud Engine ou a atualização das configurações de rede encontraram problemas entre 15h22 e 18h10, horário do Pacífico dos EUA.

Fonte da imagem: NOAA/unsplash.com

O Google explicou os incidentes como um erro em seu sistema automatizado de desligamento de rede. Após reiniciar o componente que não estava funcionando corretamente, o problema foi resolvido. A ferramenta de automação ficou bloqueada até que fossem tomadas as medidas de segurança necessárias e os clientes foram informados de que não havia risco de recorrência de falhas. No entanto, a reputação manchada da empresa permite duvidar das suas declarações. A divisão de nuvem do Google prometeu revelar mais informações sobre o ocorrido ao longo do tempo.

avalanche

Postagens recentes

Reddit irá reprimir os criadores de conteúdo de treinamento de IA

A administração da plataforma Reddit anunciou que atualizará as exceções para robôs (arquivo robots.txt), que…

7 dias atrás

O desenvolvedor do Robotaxi, Cruise, é chefiado por um ex-executivo do Xbox

Marc Whitten, um engenheiro e veterano da indústria de jogos que esteve na vanguarda do…

7 dias atrás

Em resposta a inúmeras reclamações, o primeiro patch para Elden Ring: Shadow of the Erdtree tornou os jogadores mais fortes

A editora Bandai Namco e os desenvolvedores do estúdio FromSoftware anunciaram o lançamento do primeiro…

7 dias atrás