Executar grandes modelos de linguagem de IA localmente em um PC é uma tarefa que está se tornando cada vez mais popular. Para resolver isso, a AMD lançou o Gaia, um programa de código aberto projetado para executar modelos de IA locais em computadores Windows.
Fonte da imagem: amd.com
A Gaia oferece otimizações de desempenho adicionais para máquinas com processadores Ryzen AI; A inferência de IA é realizada usando o Lemonade SDK. O programa permite que os modelos sejam adaptados para diversas finalidades: eles podem compilar resumos de textos grandes ou processar problemas complexos que exigem habilidades de raciocínio. O Gaia funciona por meio de um componente de Recuperação-Geração Aumentada (RAG) que combina IA com uma base de conhecimento para fornecer ao usuário respostas mais precisas a consultas com base no contexto.
O RAG inclui quatro agentes:
Gaia resolve problemas especializados de IA usando o Lemonade SDK, executado em vários tempos de execução. O Lemonade expõe um serviço web para o modelo de linguagem e interage com o aplicativo Gaia por meio de uma API REST compatível com OpenAI. O aplicativo atua como um agente de IA que extrai e processa dados, “vetoriza” conteúdo externo (como dados do GitHub, YouTube e arquivos de texto) e os armazena em um índice vetorial local. Simplificando, o Gaia melhora as consultas dos usuários antes que elas sejam processadas pelo modelo de IA, aumentando a precisão e a relevância das respostas.
Um instalador híbrido otimizado para sistemas baseados em processadores Ryzen que permite que o Gaia use a Unidade de Processamento Neural (NPU) e os gráficos integrados do Ryzen AI para computação. Executar modelos de IA localmente tem uma série de vantagens em relação aos serviços de nuvem: os dados permanecem seguros, a latência é reduzida e, em alguns casos, o desempenho é melhorado. Além disso, os modelos locais não exigem conexão com a internet.
A Administração do Ciberespaço da China (CAC) divulgou uma minuta de medidas para regulamentar os…
Surgiram relatos na mídia de que a OpenAI está considerando veicular anúncios de "conteúdo patrocinado"…
A Samsung revelou recentemente o Exynos 2600, o primeiro processador móvel do mundo fabricado com…
A escassez de chips de memória, incluindo RAM, já teve um impacto negativo no mercado…
Até 2025, a qualidade dos deepfakes — mídias criadas usando inteligência artificial — havia melhorado…
O smartphone topo de linha Xiaomi 17 Ultra Leica Edition, criado em colaboração com a…