Embora a palavra “mainframe” possa evocar imagens de rolos de fita magnética e símbolos verdes na tela de um terminal, esses sistemas continuam sendo essenciais para grandes negócios: 71% das empresas da Fortune 500 usam mainframes para tarefas de missão crítica.
O mercado de mainframes valia US$ 5,3 bilhões no ano passado, então esse é um petisco muito saboroso que a principal fabricante desses sistemas, a IBM, não vai perder. Hoje, a empresa anunciou os mainframes z17, que substituem a geração z16 e oferecem desempenho muito maior nos cenários de IA atuais.
Fonte da imagem: IBM
A nova plataforma é baseada nos processadores Telum II com arquitetura z/Architecture, anunciados no outono passado. Esta geração de chips usa a tecnologia de processo 5HPP da Samsung e inclui oito núcleos Telum de 5,5 GHz aprimorados com um subsistema de cache redesenhado e significativamente aprimorado.
As novas tendências afetaram totalmente o Telum II: cada processador recebeu suporte para formatos INT8/FP16, bem como um coprocessador de IA com desempenho de 25 TOPs (768 TOPs para um mainframe totalmente configurado). Pelos padrões atuais, esses números não parecem muito altos, mas o z17 contará com processadores Telum II emparelhados com aceleradores Spyre AI de 32 núcleos.
No momento do anúncio, estamos falando de 48 chips Spyre em cada mainframe z17, o que com 300 Tops por acelerador dá um total de 14,4 Pops (petaops), mas dentro de um ano está planejado dobrar esse número – até 96 aceleradores por mainframe, o que, levando em conta as capacidades do próprio Telum II, dará 30 Pops. A unidade DPU integrada ao Telum II ajudará a plataforma a digerir os volumes de dados típicos dos modelos modernos de IA.
De acordo com o anúncio, o z17 pode processar até 450 bilhões de operações de inferência por dia, o que é 50% a mais que o z16 anterior. Ao projetar o z17, a IBM gastou mais de 2.000 horas pesquisando o feedback de mais de cem clientes. A empresa considera o novo produto uma solução universal com mais de 250 casos de uso em tarefas de IA, inclusive como uma plataforma para IA generativa.
As primeiras remessas do z17 começarão em 18 de junho, mas ainda sem as placas aceleradoras Spyre – estas últimas estrearão mais tarde, no quarto trimestre. Para a nova plataforma, a IBM também está preparando um novo sistema operacional, o z/OS 3.2, que deve estrear no terceiro trimestre. Ele contará com suporte nativo para aceleradores de IA de hardware, bem como controles de IA para o próprio sistema. Além disso, o z/OS 3.2 introduzirá suporte para novos tipos de acesso a dados, bancos de dados NoSQL e computação em nuvem híbrida.
