Categorias: Sem categoria

Estudo diz que robôs de IA mentem mais quando solicitados a dar respostas concisas

Pesquisadores da empresa francesa de testes de IA Giskard descobriram que quanto mais curtas as respostas do ChatGPT e de outros assistentes de IA, maior a probabilidade de fornecer informações falsas. Consultas como “responda brevemente” ou “explique em duas frases” fazem com que os modelos mintam e sejam imprecisos.

Fonte da imagem: AI

Conforme escreve o TechCrunch, durante o estudo, os especialistas analisaram o comportamento de modelos de linguagem populares, incluindo o GPT-4o da OpenAI, o Mistral Large e o Claude 3.7 Sonnet da Anthropic, e descobriram que, quando solicitados a fornecer respostas curtas, especialmente em tópicos ambíguos ou controversos, os modelos têm maior probabilidade de fornecer informações errôneas. “Nossos dados mostram que mesmo mudanças simples nas instruções afetam significativamente a propensão dos modelos a ter alucinações”, disse Giskard.

As alucinações continuam sendo um dos maiores problemas não resolvidos no campo da IA ​​generativa. Mesmo modelos avançados baseados em algoritmos probabilísticos podem inventar fatos inexistentes. Novos modelos focados no raciocínio, como o o3 da OpenAI, são ainda mais propensos a alucinações do que seus antecessores, o que não pode deixar de reduzir a confiança em suas respostas, dizem os autores do estudo.

Nota-se que uma das razões para a maior tendência a cometer erros é o espaço limitado para explicações. Quando uma modelo é solicitada a ser breve, ela não consegue cobrir completamente o tópico e refutar as premissas falsas do pedido. No entanto, esse ponto é muito importante para desenvolvedores de código, pois um prompt contendo uma instrução como “seja breve” pode prejudicar a qualidade da resposta.

Além disso, observou-se que os modelos eram menos propensos a refutar declarações controversas se fossem feitas com confiança. Também foi descoberto que as IAs que os usuários mais frequentemente classificam como convenientes ou agradáveis ​​para se comunicar nem sempre apresentam um alto grau de precisão em suas respostas.

admin

Postagens recentes

A Samsung Foundry poderá obter lucro pela primeira vez em quatro anos.

A Samsung Foundry, braço de manufatura da Samsung Electronics, vem acumulando prejuízos de bilhões de…

24 minutos atrás

A Xbox não vai desistir: a empresa vê a salvação nos jogos exclusivos e no novo console Helix.

O novo diretor de estratégia da Xbox, Matthew Ball, falou no Summer Game Fest sobre…

49 minutos atrás

A PepsiCo lançou serviços de entrega de salgadinhos e bebidas sem motorista em três estados dos EUA.

A PepsiCo tornou-se a primeira grande empresa de bens de consumo nos EUA a implantar…

1 hora atrás

A Amazon assinou um acordo plurianual com a Corning para o fornecimento de cabos de fibra óptica para seus centros de dados.

A Amazon anunciou um acordo multimilionário de vários anos com a Corning Incorporated para o…

2 horas atrás

“As pessoas se esqueceram de como esperar”: parece que o tão aguardado The Wolf Among Us 2 será lançado na íntegra, em vez de em episódios.

Após um longo hiato, a Telltale Games (LCG Entertainment) finalmente revelou a data de lançamento…

2 horas atrás

China investirá US$ 295 bilhões em centros de dados de IA nos próximos cinco anos.

Não são apenas os EUA ou a UE que estão formulando programas nacionais de desenvolvimento…

2 horas atrás