O Reddit baniu permanentemente um grupo de pesquisadores da Universidade de Zurique depois que foi revelado que eles estavam usando secretamente bots de IA para influenciar psicologicamente os usuários por meses. O experimento, que os próprios cientistas chamaram de “estudo da capacidade de persuasão das redes neurais”, levou a um escândalo, e o Reddit agora está considerando entrar com uma ação judicial.

Fonte da imagem: AI
Como parte do estudo, os robôs se passaram por conselheiros psicológicos e vítimas de violência. Eles deixaram mais de 1.700 comentários na comunidade r/changemymind e acumularam mais de 10.000 karmas antes de serem expostos, escreve o The Verge. Ao mesmo tempo, o advogado-chefe do Reddit, Ben Lee, chamou o experimento não apenas de ilegal, mas também antiético.
De acordo com os dados que já vazaram online, os bots usaram os modelos GPT-4o, Claude 3.5 Sonnet e Llama 3.1-405B. Eles analisaram o histórico de postagens dos usuários para selecionar os argumentos mais convincentes. “Em todos os casos, nossos bots geraram comentários com base nas últimas 100 postagens e comentários do autor”, diz o documento.
Os pesquisadores disseram que removeram manualmente postagens que foram consideradas eticamente problemáticas ou que indicavam claramente que tinham sido escritas por um bot de IA, efetivamente escondendo rastros de seu experimento. Além disso, nas consultas às redes neurais, eles alegaram que os usuários do Reddit deram seu consentimento para participar do experimento, embora na verdade esse não tenha sido o caso.
O estudo, embora ilegal, descobriu que os bots eram de fato muito mais eficazes que os humanos na persuasão e influenciavam facilmente a opinião de seu interlocutor. Segundo os autores do trabalho, bots de IA podem ser usados para interferir em eleições ou manipular a opinião pública se caírem nas mãos de invasores.
Pesquisadores recomendam que plataformas online desenvolvam mecanismos robustos para verificar conteúdo criado por inteligência artificial. Ironicamente, porém, o próprio estudo se tornou um exemplo de intenção maliciosa e manipulação.
