SSDs NVMe parecem retardar a reinicialização dos servidores do Google

Mesmo os servidores mais confiáveis ​​às vezes precisam ser reinicializados, mesmo que seja apenas para substituir componentes com falha ou atualizar firmware. Também não é segredo que a presença de controladores complexos e placas de expansão no sistema pode diminuir o tempo de inicialização, adicionando pausas para a inicialização de tais placas. Mas recentemente, o Google enfrentou um caso único: servidores Linux equipados com muitas unidades NVMe começaram a reiniciar muito lentamente.

O fato é que na forma atual, as APIs do kernel Linux realizam o processo de desligamento e reinicialização do sistema em modo síncrono. Ao mesmo tempo, cada unidade NVMe conclui seu processo de desligamento em cerca de 4,5 segundos e, até que seja concluído, o sistema não prosseguirá para o desligamento da próxima unidade. Mas a popularidade do NVMe está crescendo e a presença de uma dúzia ou dois desses SSDs em um servidor não é mais uma raridade. Portanto, apenas o processo de desligamento do SO pode levar um minuto ou mais, o que é inaceitável do ponto de vista de minimizar o tempo de inatividade do servidor.

Foto: Google

O Google está propondo que o kernel do Linux mude para um modelo de processo de desligamento do sistema assíncrono e já desenvolveu seu próprio patch, que, no entanto, mantém a compatibilidade com o antigo modelo síncrono. Na versão atual, ele alterna todos os dispositivos no barramento PCIe para usar o modelo de chamada assíncrona e faz as alterações apropriadas no driver NVMe. Nesse caso, os comandos de desligamento são enviados sequencialmente para todos os discos de uma só vez, após o que se espera que sejam concluídos.

avalanche

Postagens recentes

“A Odisseia Vampírica Continua”: Desenvolvedores da V Rising abandonam o desenvolvimento do jogo para se dedicarem ao “Projeto Mais Ambicioso” da História do Estúdio.

Em sua primeira mensagem aos jogadores desde o verão passado, a desenvolvedora sueca Stunlock Studios…

2 horas atrás

A GlobalFoundries solicitou a proibição das importações de semicondutores da Tower para os Estados Unidos devido a uma disputa de patentes.

As disputas de patentes normalmente se tornam uma arma de competição entre empresas ocidentais e…

2 horas atrás

O Telegram prevê uma grande quantidade de agentes de IA: o aplicativo de mensagens aderiu ao desenvolvimento do OpenClaw.

Peter Steinberger, criador do OpenClaw, e os desenvolvedores do Telegram concordaram em colaborar no desenvolvimento…

2 horas atrás

Trabalhadores em todo o mundo temem demissões devido à IA e estão retardando sua adoção.

Segundo um novo estudo da consultoria Forrester, muitos funcionários temem demissões devido à introdução da…

2 horas atrás

Musk iniciou uma “limpeza” na X após a fusão com a xAI e a SpaceX.

Nos últimos meses, Elon Musk concluiu duas grandes fusões de suas empresas privadas. Primeiro, fundiu…

3 horas atrás