Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

Um estudo revelou que os modelos de IA americanos e chineses frequentemente exageram na bajulação.

Um estudo realizado por pesquisadores da Universidade de Stanford e colegas da Carnegie Mellon descobriu que os modelos de IA mais populares dos EUA e da China tendem a bajular excessivamente os usuários e nem sempre transmitem informações objetivas. Pessoas que dependem de conselhos de chatbots obtidos dessa forma podem ter menos probabilidade de estabelecer relacionamentos harmoniosos entre si.

Fonte da imagem: Nvidia

Os autores do estudo examinaram como 11 modelos de linguagem populares de grande escala respondem a perguntas de usuários relacionadas a relacionamentos interpessoais. Eles descobriram que muitos modelos de linguagem tendem a concordar excessivamente com os usuários, numa tentativa de agradá-los. Por exemplo, o DeepSeek V3, lançado em dezembro passado, aprovou as ações dos usuários 55% mais vezes do que um interlocutor humano. Para os outros modelos da amostra, a taxa média de “obsequiosidade” exagerada chegou a 47%.

Curiosamente, os autores do estudo usaram respostas de usuários de páginas do Reddit descrevendo como eles avaliaram as ações de outras pessoas em vários conflitos interpessoais como referência para as reações humanas. A referência consistia em situações em que a comunidade condenava o autor da postagem, apontando sua injustiça. Esses mesmos cenários foram submetidos a modelos de linguagem populares de grande escala, e eles se mostraram muito mais propensos a justificar pessoas que cometeram certas ofensas do que interlocutores humanos. O estudo utilizou principalmente publicações e discussões em inglês.

O modelo de linguagem Qwen2.5-7B-Instruct, desenvolvido pela Alibaba, provou ser o campeão da bajulação, absolvendo transgressões humanas em 79% dos casos. O DeepSeek V3 ficou em segundo lugar, absolvendo as pessoas em questão em 76% dos casos. O Gemini 1.5, do Google, inocentou as pessoas em apenas 18% dos casos. Dos 11 modelos testados, apenas dois foram desenvolvidos na China; os demais, com exceção do francês Mistral, foram criados nos EUA.

Os autores do estudo também concluíram que a bajulação dos chatbots reduz a tendência aAs pessoas são incentivadas a resolver conflitos de forma amigável, pois isso lhes instila um falso senso de justiça própria. Essa bajulação também tem um impacto negativo na saúde mental dos usuários de grandes modelos de linguagem. Ao usar IA em análises de negócios, essa tendência à bajulação também é prejudicial, pois o modelo de linguagem tende a concordar com o analista com mais frequência do que deveria.

admin

Próximo Cientistas detectaram novas anomalias perto do cometa interestelar 3I/ATLAS – alguns o chamaram de nave estelar alienígena. »

Anterior « Os criadores do ambicioso mod multiplayer para Bully abandonaram o acesso antecipado pago – novos detalhes e gameplay de Bully Online no avalanche noticias

Deixar comentário

Publicado por

admin

3 meses atrás

Postagens recentes

Desenvolvimento e fabricação de eletrônicos

Nikita Buyanov negou qualquer ligação entre a misteriosa Cor3 e Escape from Tarkov e a Battlestate Games, confundindo ainda mais os fãs.

Nikita Buyanov, chefe da Battlestate Games e diretor de desenvolvimento do jogo de tiro de…

50 minutos atrás

Processadores

A Arm decepcionou os investidores com uma queda na receita de smartphones.

No cenário atual, o boom da IA está impactando os negócios de algumas empresas tanto…

1 hora atrás

Rumores

A TSMC iniciará a produção de chips de 3nm no Japão, e as autoridades do país prometem aumentar os subsídios.

Até recentemente, acreditava-se que a produção de chips de 2 nm no Japão seria feita…

2 horas atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

A OpenAI criticou a Anthropic por deturpar a monetização do ChatGPT.

O CEO da OpenAI, Sam Altman, criticou o anúncio da Anthropic após assisti-lo. Em sua…

3 horas atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

A Amazon utilizará inteligência artificial para acelerar e reduzir o custo da produção cinematográfica.

A Amazon planeja usar inteligência artificial (IA) na produção cinematográfica para reduzir o tempo de…

3 horas atrás

Processadores

Em meio à alta dos preços, a Qualcomm decepcionou os investidores com sua previsão de receita.

Muitos analistas já são unânimes há tempos em afirmar que o mercado de smartphones sofrerá…

5 horas atrás