O Google Cloud conseguiu quebrar sua própria infraestrutura de rede, mas se corrigiu rapidamente

Faz apenas uma semana que o Google excluiu a conta na nuvem do fundo de aposentadoria australiano UniSuper, mas parece que os engenheiros da empresa estão apenas pegando o jeito. De acordo com o The Register, o Google Cloud interrompeu dezenas de serviços na última sexta-feira.

Inicialmente, o Google Cloud anunciou o lançamento de “automação de manutenção para desativar componentes de controle de rede não utilizados em um único local”. Mas, como resultado, a interrupção ocorreu em 40 locais ao mesmo tempo, de modo que, durante quase três horas, os usuários de 33 serviços do Google Cloud, incluindo grandes serviços como Compute Engine e Kubernetes Engine, enfrentaram uma série de problemas:

  • Novas instâncias não tinham conexão de rede;
  • Máquinas virtuais migradas/reiniciadas perderam conectividade de rede;
  • As configurações das redes virtuais (firewalls, etc.) não puderam ser atualizadas;
  • Perda parcial de pacotes para fluxos de rede VPC (Virtual Private Cloud) individuais nas regiões us-central1 e us-east1;
  • Incapacidade de alocar portas (DPA) no Cloud NAT;
  • Falha ao criar novos nós e pools do GKE (Google Kubernetes Engine).

Outros serviços que exigiam o uso de máquinas virtuais no Google Cloud Engine ou a atualização das configurações de rede encontraram problemas entre 15h22 e 18h10, horário do Pacífico dos EUA.

Fonte da imagem: NOAA/unsplash.com

O Google explicou os incidentes como um erro em seu sistema automatizado de desligamento de rede. Após reiniciar o componente que não estava funcionando corretamente, o problema foi resolvido. A ferramenta de automação ficou bloqueada até que fossem tomadas as medidas de segurança necessárias e os clientes foram informados de que não havia risco de recorrência de falhas. No entanto, a reputação manchada da empresa permite duvidar das suas declarações. A divisão de nuvem do Google prometeu revelar mais informações sobre o ocorrido ao longo do tempo.

avalanche

Postagens recentes

Os fabricantes de módulos de memória e placas-mãe começaram a aumentar os volumes de produção de produtos relacionados à DDR4.

A escassez de memória é impulsionada pela alta demanda por DDR5 no segmento de servidores,…

2 horas atrás

O Google concluiu a reformulação dos ícones do aplicativo Workspace como parte do conceito “Era Gemini”.

O Google concluiu uma atualização global do logotipo para todos os aplicativos do Workspace no…

2 horas atrás

Este ano, a escassez de chips forçará a Intel a aumentar os volumes de produção até mesmo de processadores de 10 nanômetros.

A escassez de CPUs não está ocorrendo apenas no segmento de servidores, já que a…

3 horas atrás

A Meta AI poderá apresentar reconhecimento facial através das câmeras dos óculos.

Preocupações com a privacidade em torno dos óculos inteligentes Ray-Ban Meta✴ ressurgiram. O código para…

3 horas atrás