NVIDIA NeMo Guardrails salvará bots de IA de alucinações e desvios de um determinado tópico

A NVIDIA revelou uma solução NeMo Guardrails de código aberto projetada para proteger aplicativos de IA, impedindo que bots de IA façam as chamadas alucinações (declarações falsas), discutam tópicos tabus, falem linguagem tóxica e executem ações indesejadas.

O NVIDIA NeMo Guardrails foi projetado para funcionar com todos os modelos de linguagem grande (LLMs), como o ChatGPT da OpenAI. A solução permite que os desenvolvedores personalizem aplicativos baseados em LLM para serem seguros e permanecerem dentro do domínio da empresa. O NeMo Guardrails atua como uma camada intermediária entre o usuário e o LLM ou outra ferramenta de IA e evita que resultados ou dicas incorretas sejam fornecidas.

Fonte da imagem: NVIDIA

O NeMo Guardrails permite que os desenvolvedores definam três tipos de bordas:

  • Cercas de tópicos que impedem que os aplicativos se desloquem para áreas indesejadas, mantendo a conversa no tópico. Por exemplo, impedir que bots de atendimento ao cliente projetados para responder a perguntas sobre produtos respondam a perguntas sobre o clima.
  • Cercas de segurança que garantem que o LLM não divulgue desinformação ou cause reação. Você pode filtrar expressões indesejadas e garantir que apenas fontes confiáveis ​​sejam vinculadas.
  • Cercas de segurança impedem a execução de código malicioso LLM e garantem que o bot se comunique com aplicativos de terceiros apenas da lista permitida. Como a empresa enfatizou, tais medidas “ajudam a fornecer um modelo de segurança robusto e reduzem o risco de ataques baseados em LLM à medida que são detectados”.

A NVIDIA incorporou o NeMo Guardrails na plataforma NVIDIA NeMo, fornecendo as ferramentas necessárias para treinar e ajustar modelos de linguagem usando os dados da própria empresa. Grande parte do kit de ferramentas NeMo já está disponível no GitHub. As empresas também podem obtê-lo como um pacote completo e compatível incluído na NVIDIA AI Enterprise Platform.

avalanche

Postagens recentes

A Owlcat Games lançará seu próprio launcher para facilitar o acompanhamento dos projetos do estúdio pelos jogadores – Detalhes do Owlcat Launcher

A Owlcat Games, desenvolvedora de Pathfinder: Wrath of the Righteous e Warhammer 40,000: Rogue Trader,…

51 minutos atrás

A Amazfit lançou o smartwatch Active Max com tela brilhante, mapas offline e bateria com duração de 25 dias.

A Amazfit apresentou o smartwatch Active Max, com tela AMOLED de 1,5 polegadas com ajuste…

1 hora atrás

“Antes, só podíamos sonhar com algo assim”: O desenvolvedor do emulador shadPS4 encantou os fãs com uma demonstração do modo multijogador de Bloodborne no PC.

Um dos desenvolvedores do emulador shadPS4, George Moralis, mostrou em um vídeo recente o futuro…

2 horas atrás

Ondas de rádio em vez de cobre e vidro: guias de onda de plástico prometem revolucionar as interconexões de data centers com IA.

A Point2 Technology e a AttoTude estão trabalhando em cabos ARC, que podem se tornar…

5 horas atrás

As placas gráficas chinesas Lisuan 7G100, baseadas em GPUs de 6nm, entraram em produção em massa.

As placas gráficas 7G100 da fabricante chinesa Lisuan Technology, construídas com GPUs de 6 nm,…

5 horas atrás

O Telegram receberá em breve uma interface completamente nova para seu aplicativo Android, no estilo da versão para iOS.

Os desenvolvedores do Telegram começaram a testar uma interface atualizada para a plataforma Android, de…

6 horas atrás