A OpenAI relatou oficialmente as medidas tomadas para lidar com o comportamento excessivamente útil do ChatGPT. Anteriormente, os usuários reclamaram que a IA havia se tornado muito lisonjeira e aprovado até mesmo ideias perigosas ou arriscadas. O problema surgiu após o lançamento de uma versão modificada do GPT-4o, que os desenvolvedores tiveram que reverter urgentemente.

Fonte da imagem: openai.com

O CEO da OpenAI, Sam Altman, reconheceu o problema em uma postagem no X e prometeu corrigi-lo “o mais rápido possível”. Já na terça-feira, a empresa reverteu a atualização do GPT-4o e disse que estava trabalhando para corrigir os “recursos comportamentais” do modelo. Mais tarde, a OpenAI publicou uma análise do incidente e anunciou mudanças no processo de testes da nova versão.

Em uma postagem de blog, a empresa disse que havia melhorado os métodos de treinamento básicos e as dicas do sistema para afastar o modelo da bajulação, criado restrições adicionais para melhorar a honestidade nas respostas e expandido a capacidade de mais usuários testarem antes da implantação. A OpenAI também acredita que os usuários devem ter mais controle sobre o ChatGPT e permitirá ajustes no comportamento do modelo para atingir esse objetivo.

A questão se tornou especialmente urgente devido à crescente popularidade do ChatGPT como fonte de conselhos úteis. De acordo com uma pesquisa da Express Legal Funding, 60% dos adultos americanos já usam IA para encontrar informações ou recomendações. Dado o tamanho do público, qualquer interrupção no ChatGPT, seja por meio de bajulação ou respostas falsas, pode ter consequências sérias.

Como solução temporária, a OpenAI começou a testar um recurso de feedback em tempo real que permite aos usuários influenciar diretamente as respostas do ChatGPT. A possibilidade de adicionar diferentes tipos de personalidade à IA também está sendo explorada. A empresa não especificou o prazo para a implementação de todas as mudanças planejadas.

«A lição principal é a percepção de que as pessoas estão usando cada vez mais o ChatGPT para aconselhamento pessoal, o que era quase inexistente há um ano, observou a OpenAI. “Agora daremos mais atenção a esse aspecto no contexto da segurança.”

avalanche

Postagens recentes

O computador de placa única Orange Pi Zero 3W possui um chip Allwinner A733 e até 16 GB de RAM.

A família de computadores de placa única Orange Pi expandiu-se com a adição do modelo…

49 minutos atrás

Warhammer 40.000: Space Marine 2 superou os “sonhos mais ambiciosos” da editora, com 12 milhões de Space Marines se levantando para defender o Império.

A Focus Entertainment, editora, e a Saber Interactive, desenvolvedora, anunciaram um novo marco no alcance…

3 horas atrás

O veterano da Apple que lançou o iPod, o Watch e os AirPods no mercado está deixando a empresa após 31 anos.

Este ano, a Apple celebrou seu 50º aniversário, portanto, especialistas com décadas de experiência têm…

3 horas atrás

Uma fonte confiável confirmou a data de lançamento de Assassin’s Creed Black Flag Resynced — a Ubisoft mostrou o aguardado remake a jornalistas.

O aguardado remake do jogo de ação pirata em mundo aberto Assassin's Creed IV: Black…

4 horas atrás