O Reddit baniu permanentemente um grupo de pesquisadores da Universidade de Zurique depois que foi revelado que eles estavam usando secretamente bots de IA para influenciar psicologicamente os usuários por meses. O experimento, que os próprios cientistas chamaram de “estudo da capacidade de persuasão das redes neurais”, levou a um escândalo, e o Reddit agora está considerando entrar com uma ação judicial.

Fonte da imagem: AI

Como parte do estudo, os robôs se passaram por conselheiros psicológicos e vítimas de violência. Eles deixaram mais de 1.700 comentários na comunidade r/changemymind e acumularam mais de 10.000 karmas antes de serem expostos, escreve o The Verge. Ao mesmo tempo, o advogado-chefe do Reddit, Ben Lee, chamou o experimento não apenas de ilegal, mas também antiético.

De acordo com os dados que já vazaram online, os bots usaram os modelos GPT-4o, Claude 3.5 Sonnet e Llama 3.1-405B. Eles analisaram o histórico de postagens dos usuários para selecionar os argumentos mais convincentes. “Em todos os casos, nossos bots geraram comentários com base nas últimas 100 postagens e comentários do autor”, diz o documento.

Os pesquisadores disseram que removeram manualmente postagens que foram consideradas eticamente problemáticas ou que indicavam claramente que tinham sido escritas por um bot de IA, efetivamente escondendo rastros de seu experimento. Além disso, nas consultas às redes neurais, eles alegaram que os usuários do Reddit deram seu consentimento para participar do experimento, embora na verdade esse não tenha sido o caso.

O estudo, embora ilegal, descobriu que os bots eram de fato muito mais eficazes que os humanos na persuasão e influenciavam facilmente a opinião de seu interlocutor. Segundo os autores do trabalho, bots de IA podem ser usados ​​para interferir em eleições ou manipular a opinião pública se caírem nas mãos de invasores.

Pesquisadores recomendam que plataformas online desenvolvam mecanismos robustos para verificar conteúdo criado por inteligência artificial. Ironicamente, porém, o próprio estudo se tornou um exemplo de intenção maliciosa e manipulação.

avalanche

Postagens recentes

A Microsoft corrigiu três vulnerabilidades zero-day perigosas e outras 200 falhas em seu software.

A Microsoft lançou sua atualização de junho na terça-feira de atualizações, corrigindo 200 vulnerabilidades, incluindo…

2 horas atrás

Inteligência artificial ajuda a atualizar drivers AMD Radeon que têm quase 20 anos.

Segundo o Phoronix, a versão mais recente do driver gráfico Gallium3D R600, incluída no Mesa…

4 horas atrás

A NASA apresentou a tripulação da missão lunar Artemis 3, mas ela não chegará à Lua.

A NASA anunciou os nomes dos astronautas que irão ao espaço na missão Artemis 3…

4 horas atrás

A Anthropic revelou Claude Fable 5, uma “versão segura” do tão comentado Mythos.

No início deste mês, a Anthropic expandiu a disponibilidade de seu modelo de IA mais…

5 horas atrás