Em 2022, a Ventana Micro Systems anunciou os primeiros processadores RISC-V verdadeiramente para servidor, Veyron V1. O anúncio de chips que prometem competir em igualdade de condições com os melhores processadores x86 com arquitetura x86 soou alto. No entanto, o Veyron V1 não ganhou popularidade, mas recentemente a empresa anunciou a segunda geração de chips Veyron V2, que incorporou mais plenamente os princípios do design modular e recebeu uma série de melhorias.

Tal como na primeira geração, a empresa de desenvolvimento continua a aderir ao conceito de “designer de processador” com design de chiplet. No centro do Veyron V2 de 4 nm ainda está o hub de E/S baseado em AMBA CHI, cobrindo controladores de memória e barramentos PCI Express, bem como blocos IOMMU e AIA. Os chips de computação são conectados a ele por meio da interface UCIe. A latência da conexão UCIe é inferior a 7 ns.

Fonte das imagens aqui e abaixo: Ventana Micro Systems

Esses chips podem ser de diferentes tipos: tanto com núcleos de uso geral (32 núcleos por chiplet), formando o próprio processador Veyron V2, quanto contendo coprocessadores específicos para uma tarefa específica (aceleração específica de domínio, DSA). Este último pode ser representado por FPGAs, aceleradores de IA, etc. Além disso, a pedido do cliente, a Ventana também pode otimizar o hub de E/S para melhorar a eficiência dos núcleos e coprocessadores da CPU.

Na versão clássica, o Veyron V2 pode ter até seis chips com núcleos RV64GC V2, totalizando 192 núcleos. Não há suporte SMT. O desempenho específico por núcleo é ligeiramente inferior ao do AMD Zen 4c, mas de acordo com os resultados de benchmark fornecidos pela Ventana, o Veyron V2 de 192 núcleos está visivelmente à frente do AMD EPYC Bergamo 9754 (128C/256T) com um TDP semelhante de 360 W.

Um resultado tão bom foi alcançado devido à otimização da arquitetura Veyron: em comparação com a primeira geração, há um aumento de 40% no desempenho. É importante ressaltar que a segunda geração de processadores Veyron introduziu suporte para extensões vetoriais de 512 bits, extensões de matriz proprietárias, bem como uma série de outras especificações. Em geral, por uma questão de compatibilidade, os desenvolvedores optaram por permanecer dentro do perfil geral RVA23.

Os próprios núcleos V2 usam um design superescalar com execução agressiva fora de ordem e previsão avançada de ramificação. É possível decodificar e processar até 15 instruções por ciclo de clock. O volume dos caches L1 é de 512 KB para instruções e 128 KB para dados, além disso, cada núcleo possui seu próprio cache L2 com capacidade de 1 MB. O cache L3 compartilhado por todo o chiplet de 32 núcleos tem capacidade de 128 MB. O desempenho do barramento coerente interno é de até 5 TB/s.

Posicionado como uma solução para hiperescaladores, grandes data centers e HPC, o Veyron V2 possui recursos avançados de prevenção de erros e proteção de dados, desde caches ECC e suporte para inicialização segura até autenticação em nível de chiplet e funções RAS avançadas. Além disso, é implementada proteção contra ataques de canal lateral.

Apesar de o mundo RISC-V ainda ser semelhante ao “Velho Oeste”, Ventana tenta contar com padrões desenvolvidos e populares: em particular, isso se expressa no uso de UCIe para conexão de chips, suporte para tipo 1 e tipo 2, virtualização aninhada e compatibilidade com o ecossistema de software RISC-V RISE.

A abordagem da Ventana evitará as desvantagens inerentes aos aceleradores PCIe discretos (alta latência, consumo de energia e custo) e aos SoCs monolíticos complexos (custos e prazos de desenvolvimento muito elevados), reduzirá o tempo e o custo de novas soluções e também fornecerá níveis mais baixos de consumo de energia. . Em geral, a empresa tem claramente como alvo os hiperscaladores.

A visão da Ventana sobre cenários de aplicativos DSA é muito ampla – desde aceleradores de banco de dados e unidades de compactação e descompactação de dados até suporte para algoritmos específicos em tarefas analíticas e transcodificadores em sistemas de entrega de conteúdo. DPUs discretas também se tornam desnecessárias. O primeiro parceiro da Ventana foi a Imagination Technologies, uma importante desenvolvedora de GPU.

Como opções para implementação física da nova plataforma, a Ventana oferece um servidor compacto 1U contendo um chip Veyron V2 com 192 núcleos operando em frequências de até 3,6 GHz e 12 canais DDR5-5600. Muito provavelmente, a GIGABYTE se tornará a fabricante da nova plataforma. As primeiras entregas não devem ser esperadas antes do segundo trimestre de 2024.

No geral, a visão da Ventana de uma plataforma modular de alto desempenho parece promissora, e sua ênfase em DSA pode diferenciá-la da maioria dos servidores Arm que competem de frente com soluções Intel/AMD. A única questão é o apoio dos desenvolvedores de software – e aqui a ênfase dos desenvolvedores nos padrões mais abertos e amplos pode desempenhar um papel.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *