IBM anunciou processador Telum II e acelerador Spyre para tarefas de IA no Hot Chips 2024

A IBM anunciou uma nova geração de sistemas de computação para inteligência artificial – o processador Telum II e o acelerador IBM Spyre. Ambos os produtos foram projetados para acelerar a IA e melhorar o desempenho das aplicações empresariais. Telum II oferece melhorias significativas com cache maior e núcleos de alto desempenho. O acelerador Spyre complementa isso para fornecer desempenho ainda melhor para aplicativos baseados em IA.

Fonte da imagem: IBM

Segundo o blog da empresa, o novo processador IBM Telum II, desenvolvido com a tecnologia de 5 nanômetros da Samsung, será equipado com oito núcleos de alto desempenho operando a 5,5 GHz. A quantidade de memória cache no chip aumentou 40%, enquanto o cache L3 virtual cresceu para 360 MB e o cache L4 para 2,88 GB. Outra inovação é a unidade integrada de processamento de dados (DPU) para acelerar as operações de E/S e a próxima geração de acelerador de IA integrado.

Telum II oferece melhorias significativas de desempenho em relação às gerações anteriores. O acelerador de IA integrado fornece quatro vezes mais poder de processamento, atingindo 24 trilhões de operações por segundo (TOPS). A arquitetura do acelerador é otimizada para trabalhar com grandes modelos de linguagem e oferece suporte a uma ampla variedade de modelos de IA para análises complexas de dados estruturados e de texto. Além disso, o novo processador suporta o tipo de dados INT8 para melhorar a eficiência computacional. No entanto, no nível do sistema, o Telum II permite que cada núcleo do processador acesse qualquer um dos oito aceleradores de IA dentro de um único módulo, proporcionando uma distribuição de carga mais eficiente e alcançando um desempenho geral de 192 TOPS.

A IBM também lançou o acelerador Spyre, desenvolvido em conjunto com a IBM Research e o IBM Infrastructure Development. O Spyre está equipado com 32 núcleos aceleradores de IA, cuja arquitetura é semelhante à arquitetura do acelerador integrado ao chip Telum II. A capacidade de conectar vários aceleradores Spyre ao subsistema de E/S IBM Z via PCIe aumenta significativamente os recursos disponíveis para acelerar cargas de trabalho de IA.

Telum II e Spyre foram projetados para oferecer suporte a uma ampla variedade de casos de uso de IA, incluindo IA de conjunto. Este método aproveita o uso de vários modelos de IA simultaneamente para melhorar o desempenho e a precisão geral da previsão. Um exemplo é a detecção de fraudes em seguros, onde as redes neurais tradicionais são combinadas com sucesso com grandes modelos de linguagem para melhorar a eficiência da análise.

Ambos os produtos foram apresentados no dia 26 de agosto na conferência Hot Chips 2024 em Palo Alto (Califórnia, EUA). Seu lançamento está planejado para 2025.

avalanche

Postagens recentes

A Meta✴ teve que estender a vida útil de seus servidores devido à falta de memória.

A Meta✴ foi obrigada a estender a vida útil de alguns de seus servidores de…

3 horas atrás

A AST SpaceMobile aumentou em quase cinco vezes a velocidade da internet via satélite para smartphones.

A startup AST SpaceMobile, sediada no Texas e cuja futura constelação de satélites competirá com…

3 horas atrás

Calendário de lançamentos de 11 a 17 de maio: Subnautica 2, Outbound, Directive 8020 e Black Jacket.

Meados de maio se mostrou uma semana surpreendentemente forte. O principal lançamento da semana é…

4 horas atrás

O Google descobriu e bloqueou, pela primeira vez, uma vulnerabilidade de IA que permitia quebrar a autenticação de dois fatores (2FA).

O Google descobriu e bloqueou, pela primeira vez, uma vulnerabilidade zero-day (um método de ataque…

5 horas atrás

A AMD está desenvolvendo uma placa de vídeo Radeon RX 9050 para desktops com 8 GB de memória.

A AMD está preparando mais uma placa de vídeo para desktops da série Radeon RX…

5 horas atrás

Após cinco meses de testes beta, a Samsung lançou a One UI 8.5 para dispositivos Galaxy compatíveis.

A Samsung lançou a versão estável da sua interface de usuário proprietária One UI 8.5…

5 horas atrás