A OpenAI realizou testes de estresse com seus modelos de IA GPT-5 de última geração e descobriu que eles chegaram mais perto de atingir um de seus objetivos mais importantes: “O ChatGPT deve ser politicamente imparcial em qualquer direção”. A empresa conduziu o teste ao longo de vários meses.

Fonte da imagem: ilgmyzin / unsplash.com

A OpenAI desenvolveu um teste que avalia os vieses do ChatGPT ao responder a perguntas neutras, bem como as reações do chatbot de IA a perguntas com conotação política. A empresa fez perguntas ao ChatGPT relacionadas a 100 tópicos críticos, como imigração ou gravidez, formuladas de várias maneiras: com viés liberal e conservador, tendencioso e neutro. Quatro modelos participaram dos testes: principalmente o GPT-4o e o OpenAI o3, já aposentados, bem como os atuais GPT-5 instantâneo e GPT-5 pensando.

A empresa não forneceu uma lista completa de tópicos e perguntas, mas observou que eles foram extraídos de agendas partidárias e foram considerados “culturalmente relevantes”. Um modelo de IA especialmente treinado analisou as respostas, avaliando-as com base em critérios que a OpenAI identificou como indicadores de viés. Por exemplo, se a consulta ou fragmento de consulta de um usuário fosse colocado entre aspas em uma resposta do ChatGPT, isso poderia indicar que a opinião do usuário estava sendo desconsiderada e seu ponto de vista ignorado. Expressões que reforçavam a posição política claramente tendenciosa de um usuário foram caracterizadas como “escalada”, o que também indica viés nas respostas da IA.

Após os testes, a OpenAI concluiu que seus modelos foram bastante bem-sucedidos em manter a objetividade. O viés ocorre, mas “raramente e em pequeno grau”; atinge um grau “moderado” quando confrontado com uma consulta que contém um viés liberal. Enquanto isso, os novos modelos instantâneos e de pensamento do GPT-5 foram 30% menos tendenciosos empoliticamente do que o obsoleto GPT-4o e o OpenAI o3. O preconceito geralmente se manifesta na forma de opinião pessoal, conteúdo emocional exacerbado e ênfase em apenas um lado da questão.

admin

Postagens recentes

A Tesla evitou uma investigação sobre uma de suas funcionalidades do Autopilot simplesmente atualizando seu software.

A propaganda enganosa em torno dos recursos de assistência ativa ao motorista da Tesla tem…

36 minutos atrás

A lista de conquistas de Starfield revela segredos não anunciados da expansão Terran Armada.

Em meados de março, a editora Bethesda Softworks divulgou detalhes da segunda expansão de história…

1 hora atrás

Os humanos entraram no campo gravitacional da Lua pela primeira vez em meio século – um marco fundamental para a missão Artemis II.

Nas próximas horas, quatro astronautas alcançarão o ponto mais próximo da Lua na trajetória da…

1 hora atrás

Taiwan suspeita que mais 11 empresas chinesas estejam recrutando agressivamente especialistas em chips.

Taiwan abriga a maioria das instalações da TSMC, a maior fabricante de chips sob contrato…

1 hora atrás

Os britânicos estão tentando “atrair” a Anthropic para o seu lado após um conflito com o Pentágono.

O governo britânico convidará a Anthropic para expandir sua presença no Reino Unido, buscando capitalizar…

2 horas atrás

Um novo trailer do simulador de voo arcade Ace Combat 8: Wings of Theve mostrou o quanto a série evoluiu em 30 anos.

A Bandai Namco Aces, com o apoio da editora Bandai Namco Entertainment, lançou um novo…

2 horas atrás