A NVIDIA Corporation atualizou uma série de aceleradores L40, apresentados no outono passado como parte da plataforma OVX. O novo produto chamado NVIDIA L40S está posicionado como um acelerador universal no fator de forma de uma placa de expansão FHFL de dois slots com uma interface PCIe 4.0 x16, adequada para resolver praticamente qualquer tarefa.
De muitas maneiras, o L40S repete o L40 – também é baseado na arquitetura Ada Lovelace, equipada com uma GPU AD102, complementada por 48 GB de memória GDDR6 ECC (384 bits, 864 GB / s). O acelerador possui 18.176 núcleos CUDA, 142 núcleos RT de terceira geração e 568 núcleos tensores de quarta geração. Ou seja, não há diferenças do L40 nisso. Mas o valor do TDP da novidade é 50 W maior e é de 350 W, ela ainda conta com resfriamento passivo.

Fonte da imagem aqui e abaixo: NVIDIA
Ao mesmo tempo, o L40S consegue ser quase duas vezes mais rápido que o L40 em todos os formatos de computação usando núcleos tensores, mas sem o Tensor Core, seu desempenho FP32 aumentou minimamente – de 90,5 para 91,6 Tflops. A novidade não adquiriu suporte para a ponte NVLink. O L40S está equipado com quatro portas DP 1.4a com suporte para NVIDIA Mosaic e Quadro Sync. Perfis vGPU para vDWS, GRID vApps/vPC, vCS também estão disponíveis. Há suporte para inicialização segura com raiz de confiança e conformidade com o padrão NEBS nível 3.

Assim, a novidade é adequada não apenas como acelerador para treinamento de modelos de IA ou sistemas de inferência, mas também como base para sistemas de renderização de gráficos 3D, visualização ou criação e execução de aplicativos para metauniversos. A NVIDIA observa que, em tarefas de IA, o L40S supera o A100 em 1,2-1,7 vezes, e a presença de três mecanismos NVENC / NVDEC com suporte AV1 permite que o novo acelerador seja usado como uma plataforma de transcodificação de vídeo eficaz.
