A empresa eslovaca Tachyum apresentou oficialmente os processadores de servidor Prodigy, nos quais vem trabalhando há vários anos. De acordo com os criadores, estes são os primeiros chips verdadeiramente universais do mundo que podem substituir simultaneamente a CPU, GPU e TPU. Além disso, Tachyum afirma que seus processadores não são apenas mais rápidos que todos os outros, mas também mais baratos e mais eficientes em termos de energia.

A versatilidade do Prodigy reside, entre outras coisas, na capacidade de executar arquivos binários compilados para as arquiteturas x86-64, Arm e RISC-V, além de aplicativos nativos desse ISA de 64 bits. Tachyum diz que seus chips serão adequados para tarefas de IA e HPC e também serão atraentes para hiperescaladores. A empresa começará a enviar amostras de teste este ano, e o início da produção em massa está previsto para o primeiro semestre de 2023. Além disso, a empresa oferece TPUs IP para sistemas de inferência IoT/Edge.

Imagens: Tachyum

O mais antigo da família de novos CPUs de 5nm, que inclui oito dispositivos, o modelo possui 128 núcleos unificados, rodando a uma frequência de 5,7 GHz. De acordo com dados preliminares, cada núcleo possui 64 KB de cache L1 para dados e instruções, além de 128 MB L2 + L3. Os detalhes sobre a arquitetura e microarquitetura dos novos produtos ainda não são descritos, mas são mencionados a execução fora de ordem e a capacidade de executar até quatro instruções por clock, bem como suporte para virtualização e funções RAS avançadas. Cada núcleo tem dois blocos de vetor de 1024 bits e um bloco de matriz de 4096 bits.

Emulador de FPGA Tachyum Prodigy

O processador é equipado com 16 controladores de memória com suporte para módulos DDR5-7200 com capacidade total de até 8 TB. Ao mesmo tempo, é possível criar sistemas de dois e quatro processadores. A comunicação com o mundo exterior é fornecida por 32 controladores PCIe, que no total fornecem 64 pistas PCIe 5.0. O TDP para este modelo não é indicado, mas a empresa fala sobre a possibilidade de usar refrigeração a ar e líquido.

As especificações básicas são impressionantes, mas ainda mais surpreendentes são as alegações de desempenho do próximo carro-chefe. No SPECrate 2017 Integer, é cerca de quatro vezes mais rápido que o Xeon Platinum 8380 e três vezes mais rápido que o EPYC 7763, a geração atual de processadores Intel e AMD. Além disso, a empresa promete que o desempenho FP64 dos novos produtos será três vezes maior que o dos próximos aceleradores NVIDIA H100, ou seja, serão cerca de 180 Tflops.

E nos cálculos do FP8, o desempenho será seis vezes maior que o do H100 de uma só vez – 24 Pflops! Ao mesmo tempo, novos itens, de acordo com Tachyum, serão mais eficientes energeticamente do que todos esses chips. Para Prodigy, é declarado suporte para FP64, FP32, TF32, BF16, INT8, FP8 e alguns formatos TAI, além de trabalhar com os chamados. cálculos esparsos (esparsados), que são importantes para cargas de trabalho de IA. É verdade que até agora o anúncio pode ser chamado de “papel”, já que a empresa não forneceu características detalhadas dos chips, limitando-se a histórias sobre o quão bons eles são.

No entanto, Tachyum relata regularmente o progresso do desenvolvimento. Atualmente, a empresa oferece aos desenvolvedores um emulador de hardware baseado em FPGA – apenas 8 núcleos Prodigy, mas com capacidade de escalar até 64 núcleos. A própria empresa usa esse emulador para depurar software. Ele já adaptou o kernel Linux e o ambiente base, UEFI, KVM/QEMU, GCC, e também portou com sucesso o FreeBSD para sua arquitetura.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *