Categorias: Desenvolvimento e fabricação de eletrônicos

A Intel e a SambaNova lançaram um produto capaz de desbancar a Nvidia no segmento de IA.

A Intel e a SambaNova anunciaram uma arquitetura heterogênea pronta para produção para inferência de IA que distribui tarefas entre diferentes tipos de hardware. A plataforma utiliza GPUs para pré-processamento, módulos SambaNova especializados para geração de tokens e processadores Xeon 6 para gerenciamento de tarefas de agentes.

Fonte da imagem: Meta✴

O sistema desenvolvido divide o processo de inferência em estágios distintos, onde cada tipo de chip executa sua função específica. Aceleradores gráficos ou de IA lidam com o processamento inicial de consultas longas (ingest) e a criação de caches de chave-valor, enquanto as unidades de dados reconfiguráveis SN50 da SambaNova cuidam da decodificação. Os processadores Intel Xeon 6, por sua vez, coordenam a distribuição da carga de trabalho e executam operações relacionadas ao agente de IA, como compilação de código e validação de resultados. Isso permitirá que o sistema abranja a mais ampla gama possível de cargas de trabalho e concorra com a Nvidia e outros players do mercado.

Fonte da imagem: SambaNova

Essa abordagem para separar o preenchimento, a decodificação e a geração de tokens, como observado pelo Tom’s Hardware, ecoa a estratégia da Nvidia para sua futura plataforma Rubin, onde funções semelhantes seriam distribuídas entre os chips Rubin CPX e as GPUs Rubin. No entanto, a principal diferença é que a solução da Nvidia ainda não chegou ao mercado, enquanto a Intel e a SambaNova poderão oferecer uma arquitetura pronta para produção já no segundo semestre de 2026.

De acordo com estimativas internas da SambaNova, os processadores Xeon 6 aceleram a compilação do LLVM em mais de 50% em comparação com chips de servidor baseados em Arm. Além disso, seu desempenho em cargas de trabalho de banco de dados vetoriais é 70% superior ao de soluções x86 concorrentes, como o AMD EPYC. Segundo representantes da empresa, esse ganho de eficiência é alcançado pela otimização das interações entre os componentes do sistema e permite que os ciclos de desenvolvimento de agentes de codificação e outros aplicativos de IA sejam significativamente reduzidos, totalmente internamente.

Uma das principais vantagens da nova arquitetura é a sua total compatibilidade com a infraestrutura de data center existente, suportando até 30 kW de potência. Isso permite que as empresas implementem a solução sem a necessidade de grandes atualizações nos sistemas de refrigeração e alimentação elétrica. A plataforma deverá estar disponível para clientes corporativos, operadores de nuvem e iniciativas de IA de governos nacionais no segundo semestre de 2026.

Kevork Kechichian, vice-presidente executivo e gerente geral do Data Center Group (DCG) da Intel, observou que o ecossistema de software para data centers…Historicamente construída sobre a arquitetura x86, a Xeon, em sua opinião, garante que servirá como uma base confiável para a computação heterogênea do futuro.

admin

Próximo Tubi tornou-se o primeiro serviço de streaming a ser integrado ao ChatGPT. »

Anterior « A Apple ocupou metade das posições no ranking dos 10 melhores smartphones para o quarto trimestre de 2025.

Deixar comentário

Publicado por

admin

3 meses atrás

Postagens recentes

O data center Meta✴ infectou uma estação de tratamento de águas residuais em uma cidade americana com uma bactéria rara

O Conselho de Serviços Públicos de Cheyenne (BOPU), autoridade de serviços públicos do Wyoming, parou…

30 minutos atrás

Rumores

A Intel está pensando em fornecer energia em ambos os lados do chip para a tecnologia de processo Intel 14A2

\nA Intel há muito elogia a mudança para a fonte de alimentação traseira como uma…

42 minutos atrás

Comentários sobre eventos recentes

A Apple concordou com a Broadcom para fornecer chips de IA personalizados até 2031

\nA Broadcom é um dos maiores fornecedores de produtos semicondutores, mas ao mesmo tempo, do…

56 minutos atrás

Notícias da rede

Xbox vai demitir 3.200 funcionários e se livrar de cinco estúdios de jogos, mas há boas notícias

\nO novo CEO do Xbox, Asha Sharma, anunciou oficialmente o início da maior reestruturação da…

1 hora atrás

QTS e Compass abandonaram a criação do maior campus de data center Digital Gateway do mundo após uma batalha de anos com residentes locais

A operadora de data center de propriedade da Blackstone, QTS, abandonou os planos de construir…

1 hora atrás

A IA avançada do Fairwater Wisconsin Data Center da Microsoft não é apenas avançada, é barulhenta

A Microsoft anunciou recentemente o lançamento de seu data center mais avançado no projeto Fairwater…

1 hora atrás