A Positron AI anunciou que captou US$ 230 milhões em uma rodada de financiamento Série B com excesso de demanda, avaliando a empresa em mais de US$ 1 bilhão. A rodada foi liderada pela ARENA Private Wealth, Jump Trading e Unless, com participação dos novos investidores Qatar Investment Authority (QIA), Arm e Helena, além dos investidores já existentes Valor Equity Partners, Atreides Management, DFJ Growth, Resilience Reserve, Flume Ventures e 1517.

O anúncio foi feito no Web Summit Qatar, destacando o crescente perfil internacional da empresa, segundo a eWeek. A Positron AI levou 34 meses para se tornar um unicórnio.

A Positron AI destacou a decisão da Jump Trading de co-liderar a rodada após se tornar cliente. “Para as cargas de trabalho que nos interessam, os gargalos são cada vez mais o consumo de memória e energia, e não a capacidade computacional teórica”, afirmou o CTO da Jump Trading. “Em nossos testes, o Positron Atlas demonstrou uma latência de ponta a ponta aproximadamente três vezes menor do que um sistema comparável baseado em NVIDIA H100 ao avaliar cargas de trabalho de inferência, em um chassi refrigerado a ar pronto para produção, com uma cadeia de suprimentos que podemos planejar.”

Fonte da imagem: Positron AI

O investimento acelerará o lançamento da plataforma Asimov de próxima geração, uma plataforma projetada sob medida. A empresa planeja concluir os testes do Asimov até o final do terceiro trimestre, com versões de avaliação disponíveis até o final do primeiro trimestre de 2027. O Asimov utilizará memória LPDDR (sem HBM), mas a capacidade de atingir a largura de banda máxima teórica da memória significa que a empresa não precisa depender de HBM para geração rápida de tokens, disse o CTO da Positron ao EE Times.

Os elementos de computação do Asimov são uma evolução dos blocos Atlas, adicionando núcleos Arm e uma interconexão aprimorada. A memória LPDDR5x do Asimov pode ser expandida usando CXL, de 864 GB para 2,3 TB por chip. O chip permite dois domínios de memória independentes para melhor utilização da memória. A interface do host do chip é PCI 6.0 x32.

Embora o LPDDR5x seja mais barato e tenha maior capacidade do que o HBM, ele perde significativamente em largura de banda. Embora os aceleradores Rubin da NVIDIA apresentem 288 GB de memória HBM4 com uma largura de banda máxima de 22 TB/s, a largura de banda máxima do Asimov parece ser em torno de 3 TB/s, de acordo com o The Register (a ficha técnica lista 2,76 TB/s). Segundo a Positron, a diferença reside no fato de que seus chips conseguem utilizar 90% dessa largura de banda, enquanto as GPUs baseadas em HBM mal atingem 30% de sua largura de banda máxima em uso real, mesmo que a memória do Rubin seja aproximadamente 2,4 vezes mais rápida que a do Asimov.

Fonte da imagem: Positron AI

A empresa informou que o chip de 400 W está equipado com uma matriz sistólica de 512×512 operando a 2 GHz e suportando os tipos de dados TF32, FP16/BF16, FP8, NVFP4 e INT4. Essa matriz é controlada por vários núcleos Armv9 e pode ser reconfigurada, por exemplo, para 128×512 (GEMV) ou 512×128 (GEMM), dependendo de qual opção for mais eficiente para uma tarefa específica.

Quatro chips Asimov formam uma plataforma Titan 4U com resfriamento a ar e 16 Tbps de largura de banda entre chips. A empresa observou que o Asimov foi projetado para suportar 2 TB de memória por acelerador e 8 TB de memória por sistema Titan, com largura de banda de memória semelhante à do acelerador NVIDIA Rubin. Em escala de rack, isso se traduz em mais de 100 TB de memória. Até 4.096 sistemas Titan (16.384 aceleradores) podem ser combinados em um único domínio escalável com mais de 32 PB de memória. Isso é possível graças à interconexão direta entre chips, em vez das redes escaláveis ​​comutadas encontradas nas arquiteturas de rack da NVIDIA ou AMD.

A Positron enfatizou que sua arquitetura centrada em memória permite o processamento de cargas de trabalho de inferência de alto desempenho, incluindo modelos de linguagem de contexto extenso, fluxos de trabalho baseados em agentes e modelos de mídia e vídeo de última geração.

Se você encontrar um erro, selecione-o com o mouse e pressione CTRL+ENTER. | Você consegue escrever um melhor? Ficaremos felizes em receber seu feedback.

Fonte:

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *