A OpenAI relatou oficialmente as medidas tomadas para lidar com o comportamento excessivamente útil do ChatGPT. Anteriormente, os usuários reclamaram que a IA havia se tornado muito lisonjeira e aprovado até mesmo ideias perigosas ou arriscadas. O problema surgiu após o lançamento de uma versão modificada do GPT-4o, que os desenvolvedores tiveram que reverter urgentemente.

Fonte da imagem: openai.com

O CEO da OpenAI, Sam Altman, reconheceu o problema em uma postagem no X e prometeu corrigi-lo “o mais rápido possível”. Já na terça-feira, a empresa reverteu a atualização do GPT-4o e disse que estava trabalhando para corrigir os “recursos comportamentais” do modelo. Mais tarde, a OpenAI publicou uma análise do incidente e anunciou mudanças no processo de testes da nova versão.

Em uma postagem de blog, a empresa disse que havia melhorado os métodos de treinamento básicos e as dicas do sistema para afastar o modelo da bajulação, criado restrições adicionais para melhorar a honestidade nas respostas e expandido a capacidade de mais usuários testarem antes da implantação. A OpenAI também acredita que os usuários devem ter mais controle sobre o ChatGPT e permitirá ajustes no comportamento do modelo para atingir esse objetivo.

A questão se tornou especialmente urgente devido à crescente popularidade do ChatGPT como fonte de conselhos úteis. De acordo com uma pesquisa da Express Legal Funding, 60% dos adultos americanos já usam IA para encontrar informações ou recomendações. Dado o tamanho do público, qualquer interrupção no ChatGPT, seja por meio de bajulação ou respostas falsas, pode ter consequências sérias.

Como solução temporária, a OpenAI começou a testar um recurso de feedback em tempo real que permite aos usuários influenciar diretamente as respostas do ChatGPT. A possibilidade de adicionar diferentes tipos de personalidade à IA também está sendo explorada. A empresa não especificou o prazo para a implementação de todas as mudanças planejadas.

«A lição principal é a percepção de que as pessoas estão usando cada vez mais o ChatGPT para aconselhamento pessoal, o que era quase inexistente há um ano, observou a OpenAI. “Agora daremos mais atenção a esse aspecto no contexto da segurança.”

avalanche

Postagens recentes

A Basis apresenta o Basis Dynamix Enterprise com suporte expandido para sistemas de armazenamento domésticos e novos recursos de SDN.

A Basis, líder no mercado russo de software para gerenciamento de infraestrutura dinâmica, anuncia o…

1 hora atrás

“Eu mesmo não gosto de lixo de IA”: CEO da Nvidia começou a “entender” as críticas ao DLSS 5.

O CEO da Nvidia, Jensen Huang, em entrevista ao blogueiro Lex Fridman, comentou mais uma…

1 hora atrás

A Nintendo reduziu pela metade seu plano de produção do console Switch 2 devido às fracas vendas nos EUA.

O console de jogos Switch 2 estreou com vendas recordes, mas os meses subsequentes ficaram…

1 hora atrás

A OpenAI considera sua dependência da Microsoft um risco para os investidores.

Antes de a OpenAI começar a captar ativamente recursos de investidores estratégicos, ela dependia há…

2 horas atrás

A Tecno integra o OpenClaw em seus smartphones para permitir que os usuários automatizem tarefas rotineiras.

A fabricante de smartphones Tecno, que recentemente apresentou um conceito de smartphone modular, está agora…

3 horas atrás

A concorrente da Amazon, Starlink, está prestes a dobrar o número de lançamentos de foguetes.

A Starlink, parte do império SpaceX de Elon Musk, não é a única empresa no…

3 horas atrás