Categorias: Sem categoria

Estudo diz que robôs de IA mentem mais quando solicitados a dar respostas concisas

Pesquisadores da empresa francesa de testes de IA Giskard descobriram que quanto mais curtas as respostas do ChatGPT e de outros assistentes de IA, maior a probabilidade de fornecer informações falsas. Consultas como “responda brevemente” ou “explique em duas frases” fazem com que os modelos mintam e sejam imprecisos.

Fonte da imagem: AI

Conforme escreve o TechCrunch, durante o estudo, os especialistas analisaram o comportamento de modelos de linguagem populares, incluindo o GPT-4o da OpenAI, o Mistral Large e o Claude 3.7 Sonnet da Anthropic, e descobriram que, quando solicitados a fornecer respostas curtas, especialmente em tópicos ambíguos ou controversos, os modelos têm maior probabilidade de fornecer informações errôneas. “Nossos dados mostram que mesmo mudanças simples nas instruções afetam significativamente a propensão dos modelos a ter alucinações”, disse Giskard.

As alucinações continuam sendo um dos maiores problemas não resolvidos no campo da IA generativa. Mesmo modelos avançados baseados em algoritmos probabilísticos podem inventar fatos inexistentes. Novos modelos focados no raciocínio, como o o3 da OpenAI, são ainda mais propensos a alucinações do que seus antecessores, o que não pode deixar de reduzir a confiança em suas respostas, dizem os autores do estudo.

Nota-se que uma das razões para a maior tendência a cometer erros é o espaço limitado para explicações. Quando uma modelo é solicitada a ser breve, ela não consegue cobrir completamente o tópico e refutar as premissas falsas do pedido. No entanto, esse ponto é muito importante para desenvolvedores de código, pois um prompt contendo uma instrução como “seja breve” pode prejudicar a qualidade da resposta.

Além disso, observou-se que os modelos eram menos propensos a refutar declarações controversas se fossem feitas com confiança. Também foi descoberto que as IAs que os usuários mais frequentemente classificam como convenientes ou agradáveis para se comunicar nem sempre apresentam um alto grau de precisão em suas respostas.

admin

Próximo Atraso no GTA VI dá confiança à Electronic Arts no sucesso do novo Battlefield »

Anterior « A Arctic apresenta coolers Freezer 8 Tower acessíveis, projetados para os modernos AMD Ryzen e Intel Core

Deixar comentário

Publicado por

admin

1 ano atrás

Postagens recentes

Clientes de MI

O WhatsApp vai introduzir mensagens únicas que desaparecem após serem lidas.

O WhatsApp poderá em breve introduzir suporte para mensagens que desaparecem após serem lidas. De…

24 minutos atrás

Servidores, clusters, supercomputadores, computadores industriais e multiprocessadores

A Alibaba apresentou o acelerador Zhenwu M890, projetado para trabalhar com agentes de IA.

A T-Head, divisão do grupo chinês Alibaba especializada no desenvolvimento de chips, apresentou esta semana…

24 minutos atrás

Notícias da rede

A Wizards of the Coast cancelou um jogo de ação massivo de Dungeons & Dragons que estava sendo desenvolvido pelo novo estúdio do diretor de God of War III e Star Wars Jedi: Survivor.

Faz menos de um ano desde o anúncio da parceria entre a Wizards of the…

52 minutos atrás

Jogos

A Valve removeu um jogo gratuito do Steam que estava secretamente roubando dados dos usuários.

A Valve removeu o jogo de terror gratuito Beyond The Dark da loja digital Steam…

1 hora atrás

Software para celular

O Google Wear OS 7 recebe atualizações em tempo real, widgets e muito mais.

Na conferência I/O 2026, o Google revelou as novas funcionalidades da sua plataforma para smartwatches…

2 horas atrás

Redes e comunicações

O Bureau 1440 fornecerá internet via satélite para 135 trens de passageiros.

A operadora de satélite Bureau 1440 (parte do grupo ICS Holding) fornecerá acesso à internet…