O Google Cloud conseguiu quebrar sua própria infraestrutura de rede, mas se corrigiu rapidamente

Faz apenas uma semana que o Google excluiu a conta na nuvem do fundo de aposentadoria australiano UniSuper, mas parece que os engenheiros da empresa estão apenas pegando o jeito. De acordo com o The Register, o Google Cloud interrompeu dezenas de serviços na última sexta-feira.

Inicialmente, o Google Cloud anunciou o lançamento de “automação de manutenção para desativar componentes de controle de rede não utilizados em um único local”. Mas, como resultado, a interrupção ocorreu em 40 locais ao mesmo tempo, de modo que, durante quase três horas, os usuários de 33 serviços do Google Cloud, incluindo grandes serviços como Compute Engine e Kubernetes Engine, enfrentaram uma série de problemas:

  • Novas instâncias não tinham conexão de rede;
  • Máquinas virtuais migradas/reiniciadas perderam conectividade de rede;
  • As configurações das redes virtuais (firewalls, etc.) não puderam ser atualizadas;
  • Perda parcial de pacotes para fluxos de rede VPC (Virtual Private Cloud) individuais nas regiões us-central1 e us-east1;
  • Incapacidade de alocar portas (DPA) no Cloud NAT;
  • Falha ao criar novos nós e pools do GKE (Google Kubernetes Engine).

Outros serviços que exigiam o uso de máquinas virtuais no Google Cloud Engine ou a atualização das configurações de rede encontraram problemas entre 15h22 e 18h10, horário do Pacífico dos EUA.

Fonte da imagem: NOAA/unsplash.com

O Google explicou os incidentes como um erro em seu sistema automatizado de desligamento de rede. Após reiniciar o componente que não estava funcionando corretamente, o problema foi resolvido. A ferramenta de automação ficou bloqueada até que fossem tomadas as medidas de segurança necessárias e os clientes foram informados de que não havia risco de recorrência de falhas. No entanto, a reputação manchada da empresa permite duvidar das suas declarações. A divisão de nuvem do Google prometeu revelar mais informações sobre o ocorrido ao longo do tempo.

avalanche

Postagens recentes

A construção do gigantesco centro de dados de IA de Trump está paralisada: sem clientes, CEO demitido, ações em queda livre.

O maior projeto de construção de um campus de data center de IA do mundo,…

1 hora atrás

A Alphabet está em negociações com a Marvell para desenvolver dois chips de IA para inferência.

A Alphabet iniciou negociações com a Marvell para desenvolver chips especializados capazes de executar modelos…

3 horas atrás

A Blue Origin reutilizou, pela primeira vez, o primeiro estágio de seu gigantesco foguete New Glen.

A empresa aeroespacial de Jeff Bezos, a Blue Origin, deu um grande passo rumo à…

8 horas atrás

A Microsoft adiciona o Agente de IA à barra de tarefas do Windows 11.

A Microsoft confirmou que não tem planos de abandonar os agentes de IA no Windows…

10 horas atrás

AAEON lança o sistema CEXD-INTRBL baseado em Intel Panther Lake para desenvolvimento de robôs com IA.

A AAEON apresentou o CEXD-INTRBL, um computador industrial de formato compacto projetado para o desenvolvimento…

10 horas atrás

A App Store está prosperando novamente — e a IA pode ter contribuído para isso.

Muitos acreditavam que a inteligência artificial acabaria com os aplicativos móveis. No entanto, o desenvolvimento…

10 horas atrás