Categorias: Sem categoria

Estudo diz que robôs de IA mentem mais quando solicitados a dar respostas concisas

Pesquisadores da empresa francesa de testes de IA Giskard descobriram que quanto mais curtas as respostas do ChatGPT e de outros assistentes de IA, maior a probabilidade de fornecer informações falsas. Consultas como “responda brevemente” ou “explique em duas frases” fazem com que os modelos mintam e sejam imprecisos.

Fonte da imagem: AI

Conforme escreve o TechCrunch, durante o estudo, os especialistas analisaram o comportamento de modelos de linguagem populares, incluindo o GPT-4o da OpenAI, o Mistral Large e o Claude 3.7 Sonnet da Anthropic, e descobriram que, quando solicitados a fornecer respostas curtas, especialmente em tópicos ambíguos ou controversos, os modelos têm maior probabilidade de fornecer informações errôneas. “Nossos dados mostram que mesmo mudanças simples nas instruções afetam significativamente a propensão dos modelos a ter alucinações”, disse Giskard.

As alucinações continuam sendo um dos maiores problemas não resolvidos no campo da IA ​​generativa. Mesmo modelos avançados baseados em algoritmos probabilísticos podem inventar fatos inexistentes. Novos modelos focados no raciocínio, como o o3 da OpenAI, são ainda mais propensos a alucinações do que seus antecessores, o que não pode deixar de reduzir a confiança em suas respostas, dizem os autores do estudo.

Nota-se que uma das razões para a maior tendência a cometer erros é o espaço limitado para explicações. Quando uma modelo é solicitada a ser breve, ela não consegue cobrir completamente o tópico e refutar as premissas falsas do pedido. No entanto, esse ponto é muito importante para desenvolvedores de código, pois um prompt contendo uma instrução como “seja breve” pode prejudicar a qualidade da resposta.

Além disso, observou-se que os modelos eram menos propensos a refutar declarações controversas se fossem feitas com confiança. Também foi descoberto que as IAs que os usuários mais frequentemente classificam como convenientes ou agradáveis ​​para se comunicar nem sempre apresentam um alto grau de precisão em suas respostas.

admin

Postagens recentes

Um estágio do foguete Falcon 9 da SpaceX irá colidir com a Lua em agosto.

Em 15 de janeiro de 2025, a missão Blue Ghost Mission 1 rumo à Lua…

42 minutos atrás

De volta à ativa após sete anos: a Valve finalmente adicionou o lendário mapa Cache ao Counter-Strike 2.

A Valve anunciou o lançamento da mais recente atualização para seu jogo de tiro competitivo…

42 minutos atrás

As autoridades americanas bloquearam o fornecimento de equipamentos para fabricação de chips à empresa chinesa Hua Hong.

Enquanto um pacote de projetos de lei que imporia restrições mais amplas às remessas de…

42 minutos atrás

A receita da Seagate disparou 44% no último trimestre, impulsionada pelo boom da inteligência artificial.

Os fornecedores de discos rígidos também se beneficiaram do rápido desenvolvimento da infraestrutura de computação…

42 minutos atrás

A Apple e o Google estão ativamente interessados ​​nos serviços de fabricação de chips por contrato da Intel.

A Apple tem sido repetidamente mencionada como uma das principais candidatas à tecnologia de processo…

42 minutos atrás

A Framework precifica a GeForce RTX 5070 móvel de 12 GB em US$ 1.199 e alerta para um aumento de preço na versão de 8 GB.

Ontem, a Nvidia anunciou o lançamento de uma versão de 12 GB da GPU GeForce…

1 hora atrás