De acordo com um novo relatório do Uptime Institute, a resiliência dos data centers melhorou significativamente nos últimos cinco anos. No entanto, as interrupções ainda ocorrem e a resolução desses problemas está se tornando cada vez mais cara e demorada, em média, segundo o The Register.
De acordo com o relatório, metade dos operadores de data centers entrevistados relatou interrupções significativas ou generalizadas nos últimos três anos. Este é o nível mais baixo desde 2020, indicando que a infraestrutura está se tornando mais confiável. Ao mesmo tempo, os operadores de data centers estão encontrando cada vez mais dificuldades para melhorar os níveis de confiabilidade exigidos pelos seus SLAs (Acordos de Nível de Serviço). Embora as interrupções estejam se tornando menos frequentes, melhorias adicionais exigem esforços crescentes.
Os esforços para melhorar o tempo de atividade são parcialmente prejudicados pela crescente complexidade dos sistemas e das condições operacionais, causada pela implementação generalizada de infraestrutura com uso intensivo de recursos para treinamento e inferência de IA (Inteligência Artificial). O aumento da densidade de equipamentos nos racks, as flutuações de carga e outros fatores podem aumentar a probabilidade de falhas em cascata. Além disso, a escassez de geradores, painéis elétricos, transformadores, sistemas de refrigeração e outros equipamentos está forçando os operadores de data centers a, por vezes, utilizarem equipamentos usados ou não testados. Acredita-se que esse seja o motivo das interrupções em alguns data centers.

Fonte da imagem: Uptime Institute
As interrupções de energia são apontadas como a principal causa de falhas críticas, embora tenha havido alguma melhora nesse aspecto: enquanto as interrupções de energia representaram 54% das falhas mais graves em 2024, esse percentual caiu para 45% em 2025. No entanto, essa situação pode mudar, visto que as redes elétricas locais estão cada vez mais sobrecarregadas devido à entrada em operação de novos data centers. Embora as falhas na rede elétrica não sejam a principal causa de interrupções no futuro, elas impactarão a disponibilidade de geração local; em caso de falhas na rede, os data centers nem sempre conseguem acionar geradores a diesel e outras fontes de energia de reserva a tempo.

Fonte da imagem: Uptime Institute
Especialistas em disponibilidade operacional não se concentram apenas em sobrecargas na rede elétrica. Eles também observam que muitas interrupções em data centers estão relacionadas a rompimentos de fibra óptica e outros problemas. À medida que a infraestrutura de data centers se torna cada vez mais distribuída, as interrupções fora do data center se tornam cada vez mais importantes. Mesmo que o próprio data center esteja operando corretamente, uma configuração de rede incorreta, por exemplo, pode levar a interrupções de serviço para os clientes. SDN (Rede Definida por Software) e redistribuição automática de tráfego ajudam a mitigar esses riscos, e cada vez mais empresas não registram nenhum tempo de inatividade. Cerca de 20% dos entrevistados não registraram nenhuma interrupção de serviço de TI nos últimos três anos, uma melhora significativa em relação ao ano anterior.

Fonte da imagem: Uptime Institute
A resiliência baseada em software ajuda a mitigar os efeitos de incidentes localizados, incluindo rompimentos de cabos de fibra óptica, distribuindo as cargas de trabalho entre vários locais interconectados. No entanto, esses sistemas são inerentemente complexos. Além disso, os ataques com drones a data centers nos Emirados Árabes Unidos e no Bahrein demonstram que o balanceamento de carga é ineficaz quando uma interrupção afeta vários locais.
Embora o Uptime Institute tenha registrado menos interrupções em 2025 do que no ano anterior, o relatório sugere que as interrupções podem durar mais tempo no geral. Enquanto 55% dos incidentes relatados publicamente são resolvidos em até 12 horas, a proporção de incidentes com duração superior a 48 horas aumentou pelo segundo ano consecutivo. Muitos desses incidentes estão relacionados a falhas em cabos de fibra óptica. De acordo com o Uptime, isso ocorreu mais do que o dobro durante o período analisado em comparação com anos anteriores.
À medida que o tempo de inatividade aumenta, também aumentam os custos dos incidentes, especialmente no caso de infraestrutura de IA. Segundo o Uptime, 20% das interrupções custam atualmente mais de US$ 1 milhão. Espera-se que esse valor aumente ainda mais nos próximos anos. Se encontrar algum erro, selecione-o com o mouse e pressione CTRL+ENTER. | Você pode melhorar? Ficaremos felizes em receber seu feedback.
Fontes: