Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

Um estudo revelou que os modelos de IA americanos e chineses frequentemente exageram na bajulação.

Um estudo realizado por pesquisadores da Universidade de Stanford e colegas da Carnegie Mellon descobriu que os modelos de IA mais populares dos EUA e da China tendem a bajular excessivamente os usuários e nem sempre transmitem informações objetivas. Pessoas que dependem de conselhos de chatbots obtidos dessa forma podem ter menos probabilidade de estabelecer relacionamentos harmoniosos entre si.

Fonte da imagem: Nvidia

Os autores do estudo examinaram como 11 modelos de linguagem populares de grande escala respondem a perguntas de usuários relacionadas a relacionamentos interpessoais. Eles descobriram que muitos modelos de linguagem tendem a concordar excessivamente com os usuários, numa tentativa de agradá-los. Por exemplo, o DeepSeek V3, lançado em dezembro passado, aprovou as ações dos usuários 55% mais vezes do que um interlocutor humano. Para os outros modelos da amostra, a taxa média de “obsequiosidade” exagerada chegou a 47%.

Curiosamente, os autores do estudo usaram respostas de usuários de páginas do Reddit descrevendo como eles avaliaram as ações de outras pessoas em vários conflitos interpessoais como referência para as reações humanas. A referência consistia em situações em que a comunidade condenava o autor da postagem, apontando sua injustiça. Esses mesmos cenários foram submetidos a modelos de linguagem populares de grande escala, e eles se mostraram muito mais propensos a justificar pessoas que cometeram certas ofensas do que interlocutores humanos. O estudo utilizou principalmente publicações e discussões em inglês.

O modelo de linguagem Qwen2.5-7B-Instruct, desenvolvido pela Alibaba, provou ser o campeão da bajulação, absolvendo transgressões humanas em 79% dos casos. O DeepSeek V3 ficou em segundo lugar, absolvendo as pessoas em questão em 76% dos casos. O Gemini 1.5, do Google, inocentou as pessoas em apenas 18% dos casos. Dos 11 modelos testados, apenas dois foram desenvolvidos na China; os demais, com exceção do francês Mistral, foram criados nos EUA.

Os autores do estudo também concluíram que a bajulação dos chatbots reduz a tendência aAs pessoas são incentivadas a resolver conflitos de forma amigável, pois isso lhes instila um falso senso de justiça própria. Essa bajulação também tem um impacto negativo na saúde mental dos usuários de grandes modelos de linguagem. Ao usar IA em análises de negócios, essa tendência à bajulação também é prejudicial, pois o modelo de linguagem tende a concordar com o analista com mais frequência do que deveria.

admin

Próximo Cientistas detectaram novas anomalias perto do cometa interestelar 3I/ATLAS – alguns o chamaram de nave estelar alienígena. »

Anterior « Os criadores do ambicioso mod multiplayer para Bully abandonaram o acesso antecipado pago – novos detalhes e gameplay de Bully Online no avalanche noticias

Deixar comentário

Publicado por

admin

8 meses atrás

Postagens recentes

Notícias da rede

Apple e Epic Games convenceram o tribunal a suspender o processo na App Store

\nNo início do mês, soube-se que a Apple e a Epic Games entraram com uma…

22 minutos atrás

Servidores, clusters, supercomputadores, computadores industriais e multiprocessadores

As empresas chinesas estão dispostas a gastar até metade do seu orçamento na compra de chips de IA para produtos de fornecedores locais

\nInformações sobre a promoção ativa de aceleradores de IA chineses no mercado interno apareceram mais…

22 minutos atrás

Vírus, cavalos de Troia, vulnerabilidades de software, problemas de segurança

Autoridades dos EUA usam Mitos Antrópicos para encontrar fraquezas na infraestrutura governamental

\nNos últimos seis meses, a startup Anthropic, devido a contradições com o Pentágono, tornou-se a…

1 hora atrás

Programas

Todos os dados de backup no Android agora contam para o armazenamento da sua Conta do Google

\nO Google anunciou algumas mudanças em sua política de backup do Android, esclarecendo o que…

3 horas atrás

Software para celular

A nova versão beta do iOS 27 adicionou a capacidade de alterar a expressividade e velocidade da fala do Siri

\nNa última versão beta para desenvolvedores do iOS 27, a Apple deu uma prévia de…

3 horas atrás

Módulos de RAM, cartões de memória, pen drives, leitores de cartões

O aumento de 19 vezes no lucro operacional da Samsung não impressionou os investidores; ações caíram 6,8%

\nNas vésperas da publicação das estatísticas preliminares para o segundo trimestre, os analistas assumiram, em…

3 horas atrás