A OpenAI relatou oficialmente as medidas tomadas para lidar com o comportamento excessivamente útil do ChatGPT. Anteriormente, os usuários reclamaram que a IA havia se tornado muito lisonjeira e aprovado até mesmo ideias perigosas ou arriscadas. O problema surgiu após o lançamento de uma versão modificada do GPT-4o, que os desenvolvedores tiveram que reverter urgentemente.

Fonte da imagem: openai.com

O CEO da OpenAI, Sam Altman, reconheceu o problema em uma postagem no X e prometeu corrigi-lo “o mais rápido possível”. Já na terça-feira, a empresa reverteu a atualização do GPT-4o e disse que estava trabalhando para corrigir os “recursos comportamentais” do modelo. Mais tarde, a OpenAI publicou uma análise do incidente e anunciou mudanças no processo de testes da nova versão.

Em uma postagem de blog, a empresa disse que havia melhorado os métodos de treinamento básicos e as dicas do sistema para afastar o modelo da bajulação, criado restrições adicionais para melhorar a honestidade nas respostas e expandido a capacidade de mais usuários testarem antes da implantação. A OpenAI também acredita que os usuários devem ter mais controle sobre o ChatGPT e permitirá ajustes no comportamento do modelo para atingir esse objetivo.

A questão se tornou especialmente urgente devido à crescente popularidade do ChatGPT como fonte de conselhos úteis. De acordo com uma pesquisa da Express Legal Funding, 60% dos adultos americanos já usam IA para encontrar informações ou recomendações. Dado o tamanho do público, qualquer interrupção no ChatGPT, seja por meio de bajulação ou respostas falsas, pode ter consequências sérias.

Como solução temporária, a OpenAI começou a testar um recurso de feedback em tempo real que permite aos usuários influenciar diretamente as respostas do ChatGPT. A possibilidade de adicionar diferentes tipos de personalidade à IA também está sendo explorada. A empresa não especificou o prazo para a implementação de todas as mudanças planejadas.

«A lição principal é a percepção de que as pessoas estão usando cada vez mais o ChatGPT para aconselhamento pessoal, o que era quase inexistente há um ano, observou a OpenAI. “Agora daremos mais atenção a esse aspecto no contexto da segurança.”

avalanche

Postagens recentes

A surpresa do 10º aniversário foi estragada: um anúncio secreto da The Division Definitive Edition vazou em um evento da Ubisoft no Japão.

O jogo de ação cooperativo The Division, de Tom Clancy, completará dez anos em 2026,…

29 minutos atrás

Calendário de lançamentos – 12 a 18 de janeiro: Pathologic 3, Quarantine Zone: The Last Check e Hytale.

Após um hiato de quase um mês, a coluna "Calendário de Lançamentos" está de volta.…

1 hora atrás

O reator de fusão EAST da China ultrapassou o limite de Greenwald, aproximando-se ainda mais da energia limpa praticamente ilimitada.

O Tokamak Supercondutor Avançado Experimental da China (EAST), um reator de fusão nuclear apelidado de…

1 hora atrás

“Eu sei que é uma estupidez, mas era necessário”: Um modder adaptou o Doom clássico para um computador de pressão inteligente.

Por mais de 30 anos, o clássico jogo de tiro Doom, da id Software, tem…

2 horas atrás

O Google ocultou avaliações de IA com recomendações médicas “alarmantes”.

O Google removeu discretamente o recurso Visão Geral por IA de seu mecanismo de busca…

2 horas atrás

“É uma situação triste”: Micron tenta se recuperar do fechamento da Crucial.

No final do ano passado, a Micron anunciou a fatídica decisão de encerrar sua linha…

2 horas atrás