Os aceleradores NVIDIA AI são os controladores de memória mais caros do mundo – Celestial AI oferece conexão HBM, DDR5 e processadores com óptica

Em 2024, não se pode reclamar da falta de uma interconexão adequada se o objetivo é “unir” centenas, milhares ou mesmo dezenas de milhares de aceleradores num único sistema. Existem NVIDIA NVLink e InfiniBand. O Google usa switches ópticos OCS, a AMD em breve levará o Infinity Fabric ao nível dos entrenós, e a boa e velha Ethernet não vai perder terreno de forma alguma e está encontrando uma nova vida na forma de Ultra Ethernet.

O problema não é a disponibilidade e seleção de uma interconexão adequada, mas a perda acentuada de largura de banda fora da embalagem do chip (a chamada Parede de Memória). Sim, a memória HBM é rápida, mas está fortemente ligada aos recursos de computação e, como resultado, como observou o chefe da Celestial AI em um comentário ao The Next Platform, a indústria de IA usa aceleradores NVIDIA como os controladores de memória mais caros no mundo.

A Celestial AI anunciou no ano passado que pretende criar uma interconexão “inteligente” universal baseada em fotônica, que poderia ser usada em todos os nichos que exigem troca ativa de grandes fluxos de dados, desde inter-chip (chip-to-chip) até inter-chip. nó (nó) -para nó). Recentemente, recebeu um pacote de investimento adicional no valor de US$ 175 milhões.

Fonte das imagens aqui e abaixo: Celestial AI

A tecnologia, chamada Photonic Fabric, de acordo com a Celestial AI, pode aumentar a largura de banda e a memória disponível em 25 vezes, ao mesmo tempo que consome uma ordem de magnitude menos energia do que os sistemas de interconexão existentes. Está se desenvolvendo em três direções: chips, interposers e um análogo óptico da tecnologia Intel EMIB chamado OMIB.

A Celestial AI considera, com razão, os chips como a maneira mais fácil de integrar sua tecnologia. O módulo da empresa oferece atualmente 14,4 Tbps (1,8 TB/s) de taxa de transferência fora do chip e é um pouco menor em tamanho do que a construção padrão da HBM. Mas esta é apenas a primeira geração: na segunda geração do Photonic Fabric, os blocos SerDes de 56 Gbit/s serão substituídos por blocos de classe de 112 Gbit/s (PAM4).

O notório “Muro da Memória”

Por se tratar de sistemas com desagregação de recursos, a Celestial AI se propõe a resolver o problema de acesso rápido a uma grande quantidade de memória da seguinte forma: o novo chiplet, que além da interconexão contém dois conjuntos HBM com volume total de 72 GB, também receberá suporte para quatro DIMMs DDR5 com volume total de até 2 TB. Usando uma tecnologia de processo de 5 nm, esse chip pode facilmente transformar o HBM em um cache de gravação rápida para DDR5.

Na verdade, estamos falando de uma maneira relativamente simples e relativamente acessível de transformar qualquer processador com layout de chiplet em um análogo desagregado do Intel Xeon Max ou NVIDIA Grace Hopper. Ao mesmo tempo, a latência para acesso remoto à memória não excederá 120 ns, e o consumo de energia neste caso será uma ordem de grandeza menor do que no caso do NVLink – apenas 6,2 pJ/bit versus 62,5 pJ/bit para NVIDIA .

O novo chip Celestial tornará a HBM mais relacionada ao DDR5 do que a NVIDIA

Assim, com o uso de novos controladores de memória chiplet, tornam-se reais sistemas onde todos os chips, desde a CPU até os processadores e aceleradores de rede, serão unidos por uma única interconexão fotônica e ao mesmo tempo terão um pool de memória DDR5 comum de grande capacidade. com cache HBM eficaz. A Celestial AI diz que já está trabalhando com alguns hiperescaladores e um “grande fabricante de processadores”.

Segundo o chefe da Celestial AI, amostras de chips com suporte Photonic Fabric aparecerão no segundo semestre de 2025, e a implementação em massa começará em 2027. No entanto, isso pode acabar sendo uma corrida para o fundo do poço: Ayar Labs, outro desenvolvedor de fotônica apoiado pela Intel, já mostrou um protótipo de processador com interconexão fotônica integrada.

E a Lightmatter recebeu financiamento de US$ 155 milhões em dezembro para desenvolver o interposer fotônico Passage e já estaria colaborando com clientes interessados ​​na criação de um supercomputador com 300 mil nós. Eliyan não pode ser descartado, pois propõe abandonar completamente a tecnologia interposer e substituí-la por controladores de camada física NuLink.

avalanche

Postagens recentes

Pronto para a missão: o thriller de espionagem 007 First Light, dos criadores de Hitman, alcançou o status gold duas semanas antes do lançamento.

O ambicioso thriller de espionagem 007 First Light, da desenvolvedora dinamarquesa IO Interactive (da série…

6 horas atrás

Um asteroide do tamanho de uma casa passará perto da Terra na próxima semana – ele estará quatro vezes mais perto do que a Lua.

Na segunda-feira, 18 de maio, um asteroide descoberto há poucos dias passará perto da Terra,…

7 horas atrás

O setor de tecnologia foi atingido por uma onda de demissões, com mais de 100 mil funcionários perdendo seus empregos desde o início do ano.

No início de maio, o número de demissões no setor de tecnologia ultrapassou 100 mil…

7 horas atrás

A Microsoft corrigiu um bug no Windows Autopatch que fazia com que os drivers fossem atualizados sem permissão.

A Microsoft corrigiu um bug no Windows Autopatch que fazia com que alguns dispositivos Windows…

7 horas atrás

A primeira bateria de gravidade da África será construída na África do Sul.

A empresa estatal sul-africana de energia elétrica, Eskom, anunciou o lançamento de um dos projetos…

8 horas atrás

A Devolver Digital anunciou The Talos Principle 3, o grande final da trilogia de quebra-cabeças filosóficos dos criadores de Serious Sam.

A editora Devolver Digital e a desenvolvedora Croteam (série Serious Sam) anunciaram The Talos Principle…

8 horas atrás