Qualcomm introduziu microservidores de IA com eficiência energética, solução de dispositivo AI On-Prem

A Qualcomm Technologies anunciou a Qualcomm AI On-Prem Appliance Solution, uma solução de hardware compacta e com baixo consumo de energia para processamento local de cargas de trabalho de inferência e visão computacional. A empresa também apresentou um conjunto pronto para uso de aplicativos, bibliotecas, modelos e agentes de IA, o Qualcomm Cloud AI Inference Suite, capaz de trabalhar na borda nas nuvens.

De acordo com o comunicado de imprensa, a combinação de novos produtos permite que pequenas e médias empresas e organizações industriais executem aplicações de IA personalizadas e pré-construídas nas suas instalações, incluindo cargas de trabalho de IA generativas. A Qualcomm observou que a inferência interna reduzirá significativamente os custos operacionais e o custo total total de propriedade (TCO) em comparação com o aluguel de infraestrutura de IA de terceiros.

Fonte da imagem: Qualcomm

Com a solução AI On-Prem Appliance juntamente com o AI Inference Suite, os clientes poderão usar IA generativa proprietária baseada em dados, modelos ajustados e infraestrutura de tecnologia para automatizar processos e aplicativos em praticamente qualquer ambiente, como lojas de varejo, restaurantes, pontos de venda, concessionárias, hospitais, fábricas e oficinas onde os processos de trabalho estão bem estabelecidos, repetíveis e prontos para automação.

«A solução AI On-Prem Appliance e o Cloud AI Inference Suite alteram o TCO da IA, permitindo que cargas de trabalho generativas de IA sejam processadas localmente, em vez de na nuvem”, disse a empresa, destacando que a solução AI On-Prem Appliance pode reduzir significativamente os custos operacionais de aplicativos de IA para necessidades empresariais e industriais em uma ampla variedade de áreas. Além disso, a implantação local oferece proteção contra vazamentos de dados confidenciais.

A plataforma Qualcomm AI On-Prem Appliance Solution é alimentada pela família de aceleradores Qualcomm Cloud AI. É relatado que o novo produto oferece suporte a uma ampla gama de recursos, incluindo:

  • Escalável desde um único dispositivo de desktop até um cluster montado na parede;
  • Servindo uma variedade de serviços de IA no local, incluindo agentes de voz prontos para uso, modelos de linguagem pequena (SLMs), modelos de linguagem grande (LLMs), modelos multimodais (LMMs), RAGs, IA de agente, IA plataformas de automação e muito mais;
  • Suporta uma ampla gama de modelos de IA generativa, processamento de linguagem natural e visão computacional;
  • Transmita o processamento de IA de imagens e vídeos de câmeras para aplicações de visão computacional focadas em segurança, proteção e monitoramento.

Por sua vez, o Qualcomm Cloud AI Inference Suite oferece um conjunto completo de ferramentas e bibliotecas para desenvolver ou migrar aplicativos generativos de IA para a solução AI On-Prem Appliance ou outras plataformas baseadas em aceleradores Qualcomm Cloud AI. O conjunto oferece diversas APIs para gerenciamento e administração de usuários, para chats, para geração de imagens, áudio e vídeo. Reivindica compatibilidade com API OpenAI e suporte RAG. Além disso, está disponível integração com modelos e estruturas populares de IA generativa. A implantação usando Kubernetes e bare metal é possível.

avalanche

Postagens recentes

A Meta aumentou sua receita publicitária e sua audiência, com suas ações subindo 10%.

No quarto trimestre do ano passado, a receita da Meta✴Platforms, fundada por Mark Zuckerberg, cresceu…

2 horas atrás

É preciso dois sobre rodas: anunciada a aventura cooperativa da WheelMates sobre carros de controle remoto.

O gênero de aventura cooperativa para dois jogadores está vivo e forte, graças não apenas…

2 horas atrás

As expansões de história de Vampire: The Masquerade – Bloodlines 2 podem chegar antes do prometido – a Paradox revelou seu plano de desenvolvimento para 2026.

A editora Paradox Interactive e os desenvolvedores do estúdio britânico The Chinese Room revelaram um…

3 horas atrás

O Spotify pagou US$ 11 bilhões a músicos em 2025, um novo recorde.

O Spotify, proprietário do serviço de streaming de música de mesmo nome, anunciou que pagará…

4 horas atrás

A Samsung confirmou que lançará seus primeiros óculos de realidade aumentada ainda este ano.

Na conferência de resultados trimestrais, o vice-presidente da Samsung Electronics, Seong Cho, confirmou o compromisso…

4 horas atrás

O Abismo Sem Fundo do Metaverso: Prejuízos da Meta Reality Labs Chegam a US$ 80 Bilhões em Cinco Anos, Mas Zuckerberg Não Desiste.

O trabalho da Meta✴ na criação do metaverso continua a ser dispendioso. Durante a divulgação…

4 horas atrás