Os processadores AMD EPYC Rome congelam após 1044 dias de operação contínua e não serão corrigidos

A AMD publicou (PDF) informações sobre um bug que ocorre com os processadores de servidor EPYC 7002 Rome – isso leva a um congelamento do kernel após 1044 dias de operação contínua. Ou seja, para o correto funcionamento, o servidor deverá ser reinicializado a cada 2,93 anos. E a AMD não vai corrigir esse erro.

“Fonte da imagem: amd.com”

O problema está relacionado ao fato de o núcleo não conseguir sair do modo de economia de energia CC6 (Core C6 State), que permite diminuir a tensão e diminuir a frequência quando ocioso. A AMD esclareceu que o tempo da falha pode depender da modulação do Spread Spectrum e da referência de frequência REFCLK, que ajuda o chip a controlar o tempo.

Uma hipótese plausível sobre a causa do erro foi apresentada pelo usuário do Reddit acid_migrain. Segundo sua versão, o erro na realidade se manifesta não depois de 1044, mas depois de 1042 dias e 12 horas. Escala do contador de carimbo de data/hora opera a 2800 MHz. Por cálculos simples, verifica-se que 2800 × 106 × 1042,5 é aproximadamente igual a 0x3800000000000000 – existem “zeros demais para que isso não seja uma coincidência”. O problema tem duas soluções simples: reinicialize o servidor a cada 1044 dias (com base nas informações da AMD) ou desative o modo de economia de energia CC6.

Os processadores da série AMD EPYC Rome foram lançados em 2018 e é possível que alguns de seus proprietários já tenham encontrado esse problema. O fabricante acrescentou que não planeja corrigir o erro – talvez isso exija custos muito altos ou não afete tantos clientes.

avalanche

Postagens recentes

O jogo de estratégia à moda antiga Crown of Greed, no espírito de Majesty, fará você se sentir como um rei – novo trailer e data de lançamento no Steam.

O estúdio polonês Blum Entertainment, com o apoio da editora ConsoleWay, anunciou a data de…

2 horas atrás

O CEO da Nvidia deixou claro que a empresa não planeja mais investir na OpenAI e na Anthropic.

Até recentemente, acreditava-se que a Nvidia investiria os prometidos US$ 100 bilhões na OpenAI, mas…

2 horas atrás

A Broadcom espera gerar mais de 100 bilhões de dólares em receita com chips de IA no próximo ano.

A Broadcom pode estar sendo ofuscada pelo boom da IA, mas isso não a impediu…

3 horas atrás

A missão lunar Artemis da NASA tem lançamento previsto para 1º de abril.

Um problema na transferência de hélio no estágio intermediário do foguete SLS, na segunda quinzena…

6 horas atrás