A OpenAI relatou oficialmente as medidas tomadas para lidar com o comportamento excessivamente útil do ChatGPT. Anteriormente, os usuários reclamaram que a IA havia se tornado muito lisonjeira e aprovado até mesmo ideias perigosas ou arriscadas. O problema surgiu após o lançamento de uma versão modificada do GPT-4o, que os desenvolvedores tiveram que reverter urgentemente.

Fonte da imagem: openai.com

O CEO da OpenAI, Sam Altman, reconheceu o problema em uma postagem no X e prometeu corrigi-lo “o mais rápido possível”. Já na terça-feira, a empresa reverteu a atualização do GPT-4o e disse que estava trabalhando para corrigir os “recursos comportamentais” do modelo. Mais tarde, a OpenAI publicou uma análise do incidente e anunciou mudanças no processo de testes da nova versão.

Em uma postagem de blog, a empresa disse que havia melhorado os métodos de treinamento básicos e as dicas do sistema para afastar o modelo da bajulação, criado restrições adicionais para melhorar a honestidade nas respostas e expandido a capacidade de mais usuários testarem antes da implantação. A OpenAI também acredita que os usuários devem ter mais controle sobre o ChatGPT e permitirá ajustes no comportamento do modelo para atingir esse objetivo.

A questão se tornou especialmente urgente devido à crescente popularidade do ChatGPT como fonte de conselhos úteis. De acordo com uma pesquisa da Express Legal Funding, 60% dos adultos americanos já usam IA para encontrar informações ou recomendações. Dado o tamanho do público, qualquer interrupção no ChatGPT, seja por meio de bajulação ou respostas falsas, pode ter consequências sérias.

Como solução temporária, a OpenAI começou a testar um recurso de feedback em tempo real que permite aos usuários influenciar diretamente as respostas do ChatGPT. A possibilidade de adicionar diferentes tipos de personalidade à IA também está sendo explorada. A empresa não especificou o prazo para a implementação de todas as mudanças planejadas.

«A lição principal é a percepção de que as pessoas estão usando cada vez mais o ChatGPT para aconselhamento pessoal, o que era quase inexistente há um ano, observou a OpenAI. “Agora daremos mais atenção a esse aspecto no contexto da segurança.”

avalanche

Postagens recentes

Um desenvolvedor da tecnologia de pontos quânticos para TVs revelou as deficiências dos painéis de LED RGB.

No evento anual Display Week, em Los Angeles, a Nanosys, desenvolvedora da tecnologia "superquantum dot"…

18 minutos atrás

A Microsoft aprimorou a experiência do touchpad e do teclado virtual no Windows 11, além de aumentar a estabilidade do Explorador de Arquivos.

Esta semana, a Microsoft lançou quatro versões beta do Windows 11 para o programa Windows…

1 hora atrás

Os Estados Unidos estão investigando acidentes envolvendo os robôs-táxi da Avride, empresa que antes fazia parte da Yandex.

A Administração Nacional de Segurança Rodoviária dos Estados Unidos (NHTSA) abriu uma investigação sobre a…

2 horas atrás

Os usuários do Instagram foram privados da criptografia de ponta a ponta em mensagens privadas.

Em 8 de maio, o Instagram descontinuou a criptografia de ponta a ponta para mensagens…

2 horas atrás

Um grupo de aplicativos fraudulentos do CallPhantom surgiu na Play Store, com 7,3 milhões de downloads.

A Google Play Store é considerada uma plataforma relativamente segura para baixar aplicativos Android, mas…

2 horas atrás