Na primavera passada, a Ampere Computing anunciou os sucessores das séries de processadores Altra e Altra Max – chips AmpereOne com maior desempenho, eficiência energética e escalabilidade. No momento do anúncio, o AmpereOne recebia até 192 núcleos, oito canais DDR5 e 128 pistas PCIe 5.0.
Além disso, esses chips também podem operar em plataformas de soquete duplo. Mais tarde, o AmpereOne tornou-se disponível em vários provedores de nuvem, e o principal beneficiário de seu surgimento foi a Oracle, que já investiu pesadamente na Ampere Computing. A empresa transferiu todos os seus serviços em nuvem para processadores Ampere e até portou seu principal DBMS para eles. Em geral, seguiu o caminho da AWS e Alibaba Cloud com processadores Graviton e Yitian, respectivamente.
Mas se estes últimos forem exclusivos da nuvem, então os chips Ampere, embora destinados principalmente a hiperscaladores, estão mais ou menos disponíveis para pequenas empresas. Portanto, é impossível parar na corrida dos processadores, então outro dia a Ampere anunciou uma atualização da linha AmpereOne, com lançamento previsto para 2025. Os novos modelos usarão a avançada tecnologia de processo N3 da TSMC.
De acordo com os planos publicados, a família AmpereOne existirá por algum tempo em duas formas: a versão original em 2023 com controlador de memória de 8 canais e 192 núcleos no limite, produzida com tecnologia de processo de 5 nm, e uma nova de 3 nm, pronta para produção em massa. Espera-se que a variante DDR5 de 192 núcleos e 12 canais esteja disponível ainda este ano.
A versão de 3nm do AmpereOne receberá até 256 núcleos e 12 canais DDR5, mas não é a única coisa que irá diferenciá-la. Por exemplo, ele estreia as tecnologias FlexSpeed e FlexSKU, que permitem operar vários parâmetros do processador em tempo real, sem reiniciar ou desligar o sistema – velocidade do clock, pacote térmico e até mesmo o número de núcleos ativos. Ao mesmo tempo, o FlexSpeed proporcionará um aumento determinístico de desempenho, ao contrário do x86-64, afirma a empresa.
Ampere afirma que o novo AmpereOne superará o AMD EPYC Bergamo em termos de desempenho por watt e oferecerá desempenho por rack superior ao AMD EPYC Genoa. A empresa dá especial atenção à eficiência energética do AmpereOne, que consiste não só na economia de energia elétrica, mas também em espaço precioso no data center. Simplificando, a empresa está focada em aumentar a densidade do poder computacional.
Ao mesmo tempo, Ampere afirma mais uma vez que em cenários de inferência seus processadores são comparáveis a alguns aceleradores, em particular, NVIDIA A10, mas ao mesmo tempo significativamente mais baratos e econômicos. Em termos de tokens, com um desempenho de cerca de 80 tokens por segundo, a plataforma Ampere é 28% mais barata e ao mesmo tempo consome menos energia em até 67%!
Além disso, a Ampere firmou uma aliança com a Qualcomm para lançar uma plataforma de servidor que combina AmpereOne como processadores de uso geral e aceleradores Qualcomm Cloud AI 100 Ultra AI. Se os próprios processadores funcionarem com sucesso com LLMs de complexidade relativamente baixa (até 7 bilhões de parâmetros), a nova plataforma permitirá lançar redes com 70 bilhões de parâmetros. Além disso, existe uma solução pronta com VPU Quadra T1U.
Se um processador híbrido Ampere Computing com chips UCIe verá a luz do dia no futuro, dependerá das decisões tomadas pelo grupo AI Platform Alliance, liderado pela Ampere Computing no outono passado. Mas este é um cenário muito real: unidades de aceleração para cálculos específicos para tarefas de IA estão sendo implementadas ativamente não apenas em soluções de servidor como o Intel Xeon Sapphire/Emerald Rapids – os coprocessadores NPU já fizeram sua estreia em CPUs industriais e de consumo da Intel e AMD .
Ao mesmo tempo, a Ampere Computing provavelmente terá que mudar ligeiramente sua política de desenvolvimento adicional, uma vez que seus principais concorrentes não são apenas o AMD EPYC Bergamo de 128 núcleos e o próximo Intel Xeon Sierra Forest de 144 e 288 núcleos, mas também Arm processadores Google Axion e Microsoft Cobalt 100, que foram originalmente criados por hiperscaladores para suas necessidades e, portanto, são provavelmente mais otimizados para suas tarefas e, provavelmente, também mais baratos que os produtos Ampere.
A empresa taiwanesa TSMC foi uma das primeiras fabricantes de chips a construir fábricas nos…
Os representantes da Intel já notaram que não vão vender totalmente a subsidiária Altera, mas…
A Intel Corporation está atualmente reestruturando seus ativos e tentando encontrar novos proprietários para alguns…
No início deste ano, a Figura AI apresentou seu robô humanóide de segunda geração, a…
A Federação Internacional de Robótica (IFR) divulgou um estudo que mostra que o uso de…
A empresa europeia The Exploration Company poderá no futuro tornar-se concorrente da americana SpaceX no…