Intel Xeon Sapphire Rapids obtém autodiagnóstico de hardware de silício

Uma falha repentina do processador do servidor pode causar muitos problemas, mesmo que ele não esteja sozinho no sistema e você não precise parar a máquina. E embora as falhas sejam frequentemente associadas a problemas de memória, uma certa parte do próprio processador, como cache ou outros blocos, também pode falhar. Esses erros são difíceis de prever e detectar com antecedência, mas o Intel Xeon Sapphire Rapids tem um mecanismo para detectá-los.

Quando se trata de novos Xeons baseados nessa arquitetura, geralmente são fornecidos muitos dados técnicos, mas a presença de uma unidade detectora de falhas de hardware no silício Sapphire Rapids tornou-se conhecida pela primeira vez. A tecnologia é chamada de In-Field Scan (IFS) e sua existência foi revelada com o advento do driver IFS de código aberto para Linux, que foi notado pela Phoronix. O próprio driver está atualmente em revisão e contém aproximadamente 1,5 mil linhas de código.

Nó de computação do supercomputador Crossroads com dois Xeon Sapphire Rapids

A tecnologia IFS implica a possibilidade de uma verificação nuclear do processador quanto à operacionalidade e funcionalidade total do “silício”. Ele, de acordo com a Intel, é capaz de detectar problemas de hardware que não são detectados por métodos padrão, como paridade ou ECC.

Como exatamente o IFS funciona ainda não foi dito, porque. o driver fornece suporte apenas da infraestrutura de software (SO e hipervisores) – no Linux, ele simplesmente fornece interfaces sysfs. Os testes serão carregados pelo processador da mesma forma que os microcódigos. Os binários de teste IFS são específicos para a família, modelo e stepping de cada Xeon Sapphire Rapids e são carregados em uma área segura da memória após serem autenticados.

As interfaces fornecidas pelo driver IFS permitirão que OEMs ou proprietários de data centers testem em massa os processadores, seja implantando uma infraestrutura com novos servidores ou verificando rotineiramente um sistema já em execução quanto a falhas de hardware. Para os hiperescaladores, tal funcionalidade é tão importante que eles mesmos desenvolvem soluções semelhantes para testar o funcionamento dos núcleos, embora até agora sejam exclusivamente baseadas em software.

avalanche

Postagens recentes

O Google vinculou o reCAPTCHA aos Serviços do Google Play, interrompendo a verificação para usuários do Android que não possuem os serviços do Google.

O Google integrou o sistema de verificação reCAPTCHA de última geração à plataforma fechada Google…

10 horas atrás

A Samsung expande sua equipe de robótica humanoide e acelera a transformação da IA.

A Samsung Electronics expandiu sua equipe de robótica do futuro e, simultaneamente, sua divisão de…

10 horas atrás

A Nvidia gastou mais de 40 bilhões de dólares na aquisição de ativos de outras empresas este ano.

Com receitas recordes em meio ao boom da IA, a Nvidia tem investido muito mais…

15 horas atrás

Foram revelados detalhes sobre os próximos processadores da Intel: Nova Lake, Razor Lake, Titan Lake e Moon Lake, que serão lançados antes de 2028.

A Intel planeja apresentar seus processadores Nova Lake no segundo semestre deste ano. Embora muito…

15 horas atrás