Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

A Qualcomm está de volta à grande computação: os aceleradores de IA AI200 e AI250 para data centers são revelados.

A Qualcomm anunciou dois aceleradores de inferência de IA (para executar modelos de linguagem grandes pré-treinados) — o AI200 e o AI250 — que chegarão ao mercado em 2026 e 2027. Esses novos produtos foram projetados para competir com as soluções de montagem em rack da AMD e da Nvidia, oferecendo maior eficiência e menores custos operacionais para executar tarefas de IA generativa em larga escala.

Fonte da imagem: Qualcomm

Os aceleradores Qualcomm AI200 e AI250 são baseados em unidades de processamento neural (NPUs) Qualcomm Hexagon, otimizadas para cargas de trabalho de IA em data centers. A empresa vem aprimorando continuamente suas unidades de processamento neural (NPUs) Hexagon nos últimos anos, de modo que as versões mais recentes dos chips são equipadas com aceleradores escalares, vetoriais e tensores (em uma configuração 12+8+1). Eles suportam formatos de dados como INT2, INT4, INT8, INT16, FP8 e FP16, inferência microtiled para tráfego de memória reduzido, endereçamento de memória de 64 bits, virtualização e criptografia de modelo Gen AI para segurança adicional.

Os aceleradores AI200 representam o primeiro sistema de inferência para data centers da Qualcomm e oferecem até 768 GB de memória LPDDR on-chip. O sistema utilizará interfaces PCIe para escalonamento vertical e Ethernet para escalonamento horizontal. A potência estimada de um rack com aceleradores Qualcomm AI200 é de 160 kW. O sistema foi projetado para resfriamento líquido direto. O Qualcomm AI200 também oferece suporte à computação confidencial para implantações corporativas. A solução estará disponível em 2026.

O Qualcomm AI250, com lançamento previsto para o próximo ano, será lançado com uma nova arquitetura de memória que oferece mais de 10 vezes a taxa de transferência. Além disso, o sistema suportará inferência desagregada, permitindo que os recursos de memória sejam alocados dinamicamente entre os cartões. A Qualcomm o posiciona como uma solução mais eficiente e de alta largura de banda, otimizada para modelos de IA em larga escala em conversíveis. O sistema também manterá as mesmas características térmicas, de resfriamento, de segurança e de escalabilidade do AI200.

Além de desenvolver plataformas de hardware, a Qualcomm também anunciou o desenvolvimento de uma plataforma de software de ponta a ponta em hiperescala, otimizada para cargas de trabalho de inferência em larga escala. A plataforma suporta os principais kits de ferramentas de aprendizado de máquina e IA generativa, incluindo PyTorch, ONNX, vLLM, LangChain e CrewAI, garantindo a implantação perfeita do modelo. A pilha de software suportará serviços desagregados, computação confidencial e integração com um clique de modelos pré-treinados, afirma a empresa.

admin

Próximo Os tópicos agora apresentam "postagens fantasmas" que desaparecerão automaticamente do feed do avalanche noticias. »

Anterior « Fitbit lança treinador de IA baseado em Gemini e aplicativo avalanche noticias completamente redesenhado

Deixar comentário

Publicado por

admin

3 meses atrás

Postagens recentes

Servidores, clusters, supercomputadores, computadores industriais e multiprocessadores

O maior investimento da Nvidia será na OpenAI, mas não estamos falando de 100 bilhões de dólares.

Na última semana, as discussões sobre a relação entre a Nvidia e a OpenAI voltaram…

3 horas atrás

Processadores

Intel e AMD, preparem-se: a Nvidia confirmou o desenvolvimento do processador N1 para PCs em colaboração com a MediaTek.

Jensen Huang confirmou publicamente a colaboração da Nvidia com a MediaTek no desenvolvimento dos processadores…

8 horas atrás

Leitores portáteis de áudio / vídeo, gravadores de voz, livros eletrônicos

A Samsung apresentou o primeiro display E-Ink colorido do mundo com uma estrutura feita de fitoplâncton.

Quase todo o plástico que vemos ao nosso redor é feito de materiais orgânicos. Mas…

8 horas atrás

Desenvolvimento e fabricação de eletrônicos

As placas GeForce RTX 5090, com preços recomendados, esgotaram em minutos: a Nvidia lançou o primeiro lote de placas Founders Edition deste ano.

O primeiro lote de placas gráficas Founders Edition enviado para a loja oficial da Nvidia…

10 horas atrás

Zona de Quarentena: A Última Verificação – sem emoções durante a inspeção. Revisão

O apocalipse zumbi chegou. A civilização humana entrou em colapso e apenas pequenos grupos de…

10 horas atrás

Zona de Quarentena: A Última Verificação – sem emoções durante a inspeção. Análise / Jogos

O apocalipse zumbi chegou. A civilização humana entrou em colapso e apenas pequenos grupos de…

10 horas atrás