Na primavera passada, a Ampere Computing anunciou os sucessores das séries de processadores Altra e Altra Max – chips AmpereOne com maior desempenho, eficiência energética e escalabilidade. No momento do anúncio, o AmpereOne recebia até 192 núcleos, oito canais DDR5 e 128 pistas PCIe 5.0.

Além disso, esses chips também podem operar em plataformas de soquete duplo. Mais tarde, o AmpereOne tornou-se disponível em vários provedores de nuvem, e o principal beneficiário de seu surgimento foi a Oracle, que já investiu pesadamente na Ampere Computing. A empresa transferiu todos os seus serviços em nuvem para processadores Ampere e até portou seu principal DBMS para eles. Em geral, seguiu o caminho da AWS e Alibaba Cloud com processadores Graviton e Yitian, respectivamente.

Mas se estes últimos forem exclusivos da nuvem, então os chips Ampere, embora destinados principalmente a hiperscaladores, estão mais ou menos disponíveis para pequenas empresas. Portanto, é impossível parar na corrida dos processadores, então outro dia a Ampere anunciou uma atualização da linha AmpereOne, com lançamento previsto para 2025. Os novos modelos usarão a avançada tecnologia de processo N3 da TSMC.

Fonte aqui e abaixo: Ampere Computing via ServeTheHome

De acordo com os planos publicados, a família AmpereOne existirá por algum tempo em duas formas: a versão original em 2023 com controlador de memória de 8 canais e 192 núcleos no limite, produzida com tecnologia de processo de 5 nm, e uma nova de 3 nm, pronta para produção em massa. Espera-se que a variante DDR5 de 192 núcleos e 12 canais esteja disponível ainda este ano.

As tecnologias proprietárias da série Flex da Ampere permitem o gerenciamento flexível das características da plataforma

A versão de 3nm do AmpereOne receberá até 256 núcleos e 12 canais DDR5, mas não é a única coisa que irá diferenciá-la. Por exemplo, ele estreia as tecnologias FlexSpeed ​​​​e FlexSKU, que permitem operar vários parâmetros do processador em tempo real, sem reiniciar ou desligar o sistema – velocidade do clock, pacote térmico e até mesmo o número de núcleos ativos. Ao mesmo tempo, o FlexSpeed ​​​​proporcionará um aumento determinístico de desempenho, ao contrário do x86-64, afirma a empresa.

Ampere afirma que o novo AmpereOne superará o AMD EPYC Bergamo em termos de desempenho por watt e oferecerá desempenho por rack superior ao AMD EPYC Genoa. A empresa dá especial atenção à eficiência energética do AmpereOne, que consiste não só na economia de energia elétrica, mas também em espaço precioso no data center. Simplificando, a empresa está focada em aumentar a densidade do poder computacional.

Ao mesmo tempo, Ampere afirma mais uma vez que em cenários de inferência seus processadores são comparáveis ​​a alguns aceleradores, em particular, NVIDIA A10, mas ao mesmo tempo significativamente mais baratos e econômicos. Em termos de tokens, com um desempenho de cerca de 80 tokens por segundo, a plataforma Ampere é 28% mais barata e ao mesmo tempo consome menos energia em até 67%!

Além disso, a Ampere firmou uma aliança com a Qualcomm para lançar uma plataforma de servidor que combina AmpereOne como processadores de uso geral e aceleradores Qualcomm Cloud AI 100 Ultra AI. Se os próprios processadores funcionarem com sucesso com LLMs de complexidade relativamente baixa (até 7 bilhões de parâmetros), a nova plataforma permitirá lançar redes com 70 bilhões de parâmetros. Além disso, existe uma solução pronta com VPU Quadra T1U.

Se um processador híbrido Ampere Computing com chips UCIe verá a luz do dia no futuro, dependerá das decisões tomadas pelo grupo AI Platform Alliance, liderado pela Ampere Computing no outono passado. Mas este é um cenário muito real: unidades de aceleração para cálculos específicos para tarefas de IA estão sendo implementadas ativamente não apenas em soluções de servidor como o Intel Xeon Sapphire/Emerald Rapids – os coprocessadores NPU já fizeram sua estreia em CPUs industriais e de consumo da Intel e AMD .

Ao mesmo tempo, a Ampere Computing provavelmente terá que mudar ligeiramente sua política de desenvolvimento adicional, uma vez que seus principais concorrentes não são apenas o AMD EPYC Bergamo de 128 núcleos e o próximo Intel Xeon Sierra Forest de 144 e 288 núcleos, mas também Arm processadores Google Axion e Microsoft Cobalt 100, que foram originalmente criados por hiperscaladores para suas necessidades e, portanto, são provavelmente mais otimizados para suas tarefas e, provavelmente, também mais baratos que os produtos Ampere.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *