A NVIDIA lançou o serviço NeMo Retriever, que permite às empresas complementar dados de chatbots, assistentes de IA e ferramentas semelhantes com informações especializadas para obter respostas mais precisas às dúvidas. O serviço tornou-se parte da família de ferramentas em nuvem NVIDIA NeMo que permite criar, configurar e implementar modelos generativos de IA.

RAG (Retrieval Augmented Generation), um método para melhorar o desempenho de grandes modelos de linguagem (LLMs), melhora a precisão e a segurança das ferramentas de IA, preenchendo lacunas de conhecimento em modelos de linguagem com informações de fontes externas. O treinamento de cada modelo, um processo extremamente intensivo em recursos, geralmente é realizado muito raramente, ou mesmo uma vez. Ao mesmo tempo, até a próxima atualização, o modelo não tem acesso a informações completas e atualizadas, o que pode levar a imprecisões, erros, etc. alucinações.

Fonte da imagem: Faisal Mehmood/Pixabay

NeMo Retriever permite que você atualize rapidamente seu LLM com novas informações na forma de bancos de dados, páginas HTML, arquivos PDF, imagens, vídeos, etc. Em outras palavras, o modelo básico com a adição de materiais especializados se tornará visivelmente mais erudito e “mais inteligente”. Ao mesmo tempo, os dados podem ser armazenados em qualquer lugar – tanto nas nuvens quanto nos servidores das próprias empresas. A tecnologia é extremamente útil porque permite que os funcionários da empresa trabalhem com dados úteis que não estão disponíveis ao público em geral, ao mesmo tempo que aproveitam todos os benefícios da IA.

Fonte da imagem: NVIDIA

Diferentemente das ferramentas RAG abertas, a NVIDIA, segundo a própria empresa, oferece uma solução comercialmente pronta para modelos de IA disponíveis no mercado que já estão otimizados para RAG e possuem suporte, além de atualizações regulares de segurança. Em outras palavras, os clientes corporativos podem pegar modelos de IA prontos e complementá-los com seus próprios dados, sem treinamento separado que exige muitos recursos.

NeMo Retriever позволит добавить соответствующие возможности универсальной облачной платформе NVIDIA AI Enterprise, предназначенной для оптимизации разработки ИИ-приложений. Регистрация разработчиков для раннего доступа к NeMo Retriever уже началась. Cadence Design Systems, Dropbox, SAP SE и ServiceNow уже работают с NVIDIA над внедрением RAG в свои внутренние ИИ-инструменты.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *