ChatGPT e outros bots de IA são péssimos em contar notícias, segundo estudo da BBC

Os quatro chatbots de inteligência artificial mais populares do mundo cometem muitos erros ao relatar notícias, segundo um estudo da BBC. Imprecisões foram observadas em mais da metade dos casos.

Fonte da imagem: Growtika/unsplash.com

Jornalistas da BBC conduziram um experimento: eles pediram aos chatbots OpenAI ChatGPT, Microsoft Copilot, Google Gemini e Perplexity para compilar resumos de centenas de notícias da agência e, então, avaliaram as respostas dos sistemas para determinar o quão precisas elas eram. De acordo com o estudo, “51% de todas as respostas de IA a perguntas relacionadas a notícias foram classificadas como tendo problemas significativos de alguma forma”. Além disso, “19% das respostas da IA ​​com links para conteúdo da BBC continham erros factuais, como declarações factuais, números e datas incorretos”.

O chatbot Gemini do Google, em particular, deturpou radicalmente o Serviço Nacional de Saúde do Reino Unido, enquanto o ChatGPT e o Copilot continuaram a tratar políticos aposentados como se estivessem em serviço. O mau tratamento de informações pela IA é sistêmico, apontam jornalistas britânicos: ela “tinha dificuldade em distinguir entre opiniões e fatos, reclamava e frequentemente perdia contexto importante”. Anteriormente, soube-se que no iOS 18.3, a função de preparar resumos de materiais de notícias, que faz parte do pacote Apple Intelligence, foi temporariamente desativada. Nem todos os sistemas de IA tiveram o mesmo desempenho no estudo: “O Microsoft Copilot e o Google Gemini têm problemas mais significativos do que o OpenAI ChatGPT e o Perplexity”, concluiu a BBC.

O experimento mostrou mais uma vez que as informações dos chatbots de IA devem ser encaradas com cautela. A IA está avançando rapidamente, com grandes modelos de linguagem sendo lançados quase toda semana, e erros são inevitáveis ​​com tamanho volume de dados. Por outro lado, “alucinações”, isto é, respostas obviamente incorretas, são agora menos comuns em sistemas avançados do que antes. A IA está progredindo mais rápido do que a Lei de Moore sugere, escreveu recentemente o CEO da OpenAI, Sam Altman, em seu blog pessoal. Mas no momento ainda é confiar demais em chatbots, especialmente quando se trata de materiais de notícias.

avalanche

Postagens recentes

Teste rápido do SSD externo MSI Datamag de 40 Gbps / Armazenamento

A MSI continua a desenvolver sua série de SSDs portáteis magnéticos. Há um ano, a…

4 horas atrás

A Cisco apresentou um protótipo de um switch quântico universal.

A Cisco Systems apresentou um protótipo de um switch de rede universal para sistemas quânticos,…

5 horas atrás

A Microsoft Gaming é coisa do passado – a divisão de jogos recuperou o nome Xbox.

A Microsoft aposentou oficialmente o nome Microsoft Gaming para sua divisão de jogos, retornando à…

5 horas atrás

Os assinantes do Game Pass não ficarão sem Call of Duty em 2026.

Os novos jogos da franquia Call of Duty chegarão ao Game Pass com um atraso…

5 horas atrás

A Intel apresentou um laptop de referência baseado no processador Wildcat Lake – ele se parece com um MacBook Neo.

Jornalistas tiveram a oportunidade de testar um dos primeiros laptops baseados no processador Intel Wildcat…

5 horas atrás

A tecnologia 3D X-DRAM agora está sendo implementada em silício pela primeira vez, aproximando a memória RAM do futuro.

O empilhamento de células de RAM poderia aumentar significativamente a densidade de armazenamento de dados…

5 horas atrás