Categorias: Mercado de tecnologia e TI. notícia

Não há necessidade de x86: o “subprocessador” NeuReality NR1 acelera a inferência em qualquer GPU

A NeuReality anunciou o chip NR1, desenvolvido especificamente para orquestração de inferência, relata o HPCwire. Ele pode ser combinado com qualquer GPU ou acelerador de IA para aumentar a utilização da GPU para quase 100%, em comparação com a média de 30% a 50% da combinação tradicional de CPU/NIC encontrada em servidores modernos.

O chip NR1 foi projetado para substituir CPUs e NICs tradicionais, que são o gargalo para cargas de trabalho de IA, ao mesmo tempo em que oferece um aumento de seis vezes no poder de computação para permitir o rendimento máximo do acelerador e a inferência de IA em larga escala, afirma o desenvolvedor.

Como a empresa observou, há anos os desenvolvedores vêm evoluindo as GPUs para atender às demandas da IA, tornando-as mais rápidas e potentes. Mas as CPUs tradicionais, projetadas para a era da internet e não para a era da IA, permaneceram praticamente inalteradas, tornando-se um gargalo à medida que os modelos de IA se tornam mais complexos e as cargas de trabalho de IA aumentam de tamanho.

Fonte da imagem: NeuReality

O NR1 inclui todos os principais recursos de CPU necessários para executar cargas de trabalho de IA, processadores dedicados de mídia e dados, um hipervisor de hardware e blocos IP de rede complexos, proporcionando desempenho significativamente superior, menor consumo de energia e maior ROI. Nos testes da própria empresa, executando o mesmo modelo de IA generativa no mesmo acelerador de IA, seu chip NR1 rende 6,5 vezes mais tokens do que um servidor x86 com o mesmo custo e consumo de energia.

Em linha com a tendência atual de separar recursos de armazenamento e computação, a desagregação dos recursos de IA proporciona isolamento otimizado da computação de IA, observou a NeuReality. Essa separação é especialmente importante em data centers e nuvens. Plataformas tradicionais definidas por software, centradas em CPU, enfrentam desafios como alto custo, consumo de energia e gargalos no sistema ao lidar com cargas de trabalho de inferência de IA. A complexidade da infraestrutura moderna e os altos custos frequentemente limitam o uso de recursos completos de inferência, afirmou a NeuReality.

A NR1 concentra-se em descarregar o pipeline de IA de ponta a ponta. O hipervisor de IA de hardware gerencia o processamento do caminho de dados e o agendamento de tarefas, abrangendo mecanismos de pré e pós-processamento, bem como o mecanismo de rede AI-over-Fabric. Isso proporciona a melhor relação custo-benefício e os menores custos operacionais, com baixo consumo de energia, latência mínima e escalabilidade linear, afirma a empresa. Para DevOps e MLOps, a empresa fornece um SDK completo e uma camada de serviço baseada em Kubernetes.

O novo chip será usado para resolver problemas nas áreas de finanças e seguros, saúde e produtos farmacêuticos, serviços governamentais e educação, telecomunicações, varejo e comércio eletrônico, para cargas de IA generativas e de agentes, visão computacional, etc.

O NeuReality NR1 inclui:

4 decodificadores de vídeo/JPEG.
16 DSPs para áudio/fala.
16 DSPs vetoriais de uso geral.
Mecanismo de rede AI-over-Fabric (TCP/ROCEv2).
Duas portas 10/25/50/100 GbE com criptografia de tráfego instantânea.
Suporte para conexões cliente-servidor e servidor-servidor.
Dois níveis de funções de rede isoladas.

admin

Próximo Xiaomi começará a vender o carro elétrico YU7 antes do planejado »

Anterior « OSCAL PILOT 3 — um smartphone confiável e seguro com suporte de IA

Deixar comentário

Publicado por

admin

1 ano atrás

Postagens recentes

Sistemas operacionais

A Microsoft estava desenvolvendo um sistema operacional de IA distinto do Windows, com profunda integração do Copilot e de agentes.

De acordo com o Windows Central, a Microsoft explorou a possibilidade de criar um sistema…

57 minutos atrás

Carros, motos, veículos

O novo crossover R2 dá novo fôlego à Rivian: vendas superam expectativas, previsão revisada para cima.

A Rivian Automotive Inc. elevou sua previsão de vendas de veículos elétricos para este ano.…

57 minutos atrás

Monitores, projetores, sintonizadores de TV, televisões

A Philips anunciou os monitores gamer Evnia M4 de 27 polegadas com três modos de operação: 1440p a 275Hz, 1080p a 360Hz e 720p a 540Hz.

A Philips anunciou dois monitores da sua série gamer Evnia M4: o 27M4N3500PT e o…

3 horas atrás

Jogos

A Epic Games Store está oferecendo gratuitamente o clássico jogo “I Have No Mouth, and I Must Scream”, sobre os últimos humanos na Terra sendo torturados por um supercomputador enlouquecido.

Conforme prometido, no dia 2 de julho, a Epic Games Store lançou uma promoção com…

4 horas atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

A Anthropic está em negociações com a Samsung para criar seu próprio chip de IA.

Fontes informadas relataram conversas entre a Anthropic, uma desenvolvedora americana de modelos de linguagem de…