De acordo com as conclusões de uma investigação independente sobre o erro na atualização do firewall da operadora de telecomunicações Optus, em setembro, que resultou na morte de duas pessoas (três mortes haviam sido relatadas anteriormente) após elas não conseguirem contatar os serviços de emergência, os técnicos cometeram pelo menos 10 erros, segundo o jornal The Register.
O número 000 na Austrália é usado para chamar ambulâncias e outros serviços de emergência, e as operadoras de telecomunicações locais são obrigadas a garantir que as chamadas sejam encaminhadas para os serviços de emergência. Em 18 de setembro de 2025, a Optus ficou sem poder fornecer serviços de emergência por 14 horas consecutivas. Além disso, a empresa não tinha conhecimento do problema — ele foi relatado por clientes que ligaram para a central de atendimento. Como resultado da interrupção, 455 chamadas para o 000 não foram atendidas e duas pessoas morreram.
A Optus publicou recentemente um relatório do Dr. Kerry Schott detalhando o incidente. Constatou-se que os engenheiros cometeram uma série de erros e ignoraram os primeiros sinais de problemas potenciais. Alguns especialistas não compareceram às reuniões onde as possíveis consequências do trabalho planejado foram avaliadas. O trabalho em si foi realizado com uma pressa injustificada, e alguns resultados foram completamente impossíveis de monitorar.

Fonte da imagem: Icons8 Team/unsplash.com
A Optus planejou realizar 18 atualizações de firewall, mas concluiu apenas 15 sem incidentes. Para a 16ª atualização, a Optus emitiu instruções incorretas para sua contratada, a Nokia. Funcionários da Optus exigiram alterações de configuração que isolariam dispositivos de rede e bloqueariam o acesso ao gateway, impossibilitando o redirecionamento do tráfego. A Optus não havia utilizado esse procedimento durante as seis atualizações de firewall anteriores.
A Nokia, por algum motivo, escolheu um Método de Procedimento (Método de Procedimento) desatualizado de 2022, inadequado para o trabalho em questão. Os engenheiros da Nokia também presumiram erroneamente que o trabalho não impactaria o tráfego de rede. A Optus, por sua vez, classificou o trabalho como urgente, o que, na prática, significou dispensar as verificações preliminares. Após a atualização, tanto a Nokia quanto a Optus registraram indícios de interrupções na rede, mas ambas as ignoraram.
Às 2h40 da manhã, horário local, a atualização foi concluída e as equipes realizaram uma verificação final. Isso revelou que a taxa de quedas de chamadas estava aumentando, apesar da queda esperada, mas a anomalia em si não foi detectada. Por fim, a Optus optou erroneamente por usar dados nacionais com granularidade insuficiente para avaliar as flutuações no volume de chamadas, resultando na omissão de interrupções locais causadas pela falha na atualização.

Fonte da imagem: Can Ahtam/unsplash.com
Segundo o especialista, a falha foi causada por má gestão e baixo desempenho da Optus e da Nokia. Os procedimentos não foram seguidos, os métodos de trabalho foram inadequados, as verificações foram insuficientes, os controles foram ignorados e os avisos foram desconsiderados. Os especialistas da Optus hesitaram em contatar prontamente funcionários mais experientes, priorizando a velocidade em detrimento da precisão do trabalho realizado. As críticas mais severas se concentram nas equipes envolvidas na atualização malsucedida. Observa-se que tal falha durante uma atualização padrão de firewall é indesculpável — é necessária uma supervisão significativamente mais rigorosa do pessoal e das operações da Nokia.
E a situação não termina aí. Recentemente, descobriu-se que as chamadas para o número de emergência 000 nas redes das operadoras TPG, Optus e Telstra são impossíveis de serem feitas a partir de alguns smartphones Samsung com software desatualizado, o que já resultou em pelo menos uma morte. Observa-se que as operadoras de telecomunicações australianas estão tentando redirecionar o tráfego durante as interrupções, mas isso é difícil e complicado pelo fato de que diferentes smartphones se comportam de maneira diferente ao apresentar problemas. A Optus recomenda que os clientes verifiquem se conseguem ligar para o 000 e mantém uma lista de dispositivos com problemas. No entanto, os proprietários de dispositivos “cinza”, comprados online ou no exterior, ainda podem enfrentar problemas.
As interrupções nos sistemas de informação são bastante comuns e nem sempre envolvem apenas problemas financeiros ou técnicos. Por exemplo, em julho de 2024, uma interrupção global devido a uma atualização da CrowdStrike afetou 8,5 milhões de PCs com Windows. Um ano depois, descobriu-se que…O estudo afetou menos de 750 hospitais nos Estados Unidos, embora a CrowdStrike o tenha criticado duramente.
Se encontrar algum erro, selecione-o com o mouse e pressione CTRL+ENTER. | Você pode melhorar? Ficaremos felizes em receber seu feedback.
Fonte:
