A OpenAI explicou como combater problemas nas respostas da IA ​​e permitiu a remoção das restrições.

A OpenAI revelou publicamente seu problema com os goblins, motivado por um artigo da Wired. Acontece que a desenvolvedora de IA é obrigada a instruir seus modelos a “nunca falarem sobre goblins, gremlins, guaxinins, trolls, ogros, pombos ou outros animais ou criaturas”, porque esses modelos desenvolveram esse “estranho hábito” durante o treinamento.

Fonte da imagem: Vikram Singh / unsplash.com

A empresa percebeu que a IA começou a recorrer com frequência suspeita a metáforas envolvendo goblins e outras criaturas fictícias com o lançamento do modelo GPT-5.1, especialmente quando a personalidade “Nerdy” estava ativada. Com cada versão subsequente do modelo, o problema só piorou, até que se descobriu que essas metáforas bizarras estavam sendo recompensadas durante o aprendizado por reforço.

A recompensa só era concedida quando a personalidade “Nerdy” estava ativada, mas o aprendizado por reforço não garante que os comportamentos aprendidos permanecerão atrelados às condições que os originaram. Em estágios subsequentes, esse padrão comportamental poderia ser recompensado e reforçado em outros contextos, especialmente se esses resultados fossem reutilizados em ajustes supervisionados ou dados de preferências, explicou o desenvolvedor.

As menções a goblins e gremlins praticamente desapareceram em março, quando a OpenAI abandonou o modelo “Botanist”, mas ressurgiram no serviço de programação Codex com o modelo GPT-5.5 — cujo treinamento havia começado antes de a empresa descobrir a causa raiz. Portanto, foi necessário fornecer instruções adicionais ao Codex para que ele não mencionasse criaturas mitológicas. No entanto, para aqueles que preferem esse comportamento, a OpenAI disponibilizou um código para ignorar essas instruções.

admin

Compartilhar
Publicado por
admin

Postagens recentes

Os robôs ainda têm muito espaço para melhorar antes de se tornarem vizinhos seguros para os humanos.

Os desenvolvedores de robôs humanoides estão ansiosos para demonstrar progressos significativos em seu desenvolvimento, mas,…

5 horas atrás

A decisão da Sony de parar de lançar jogos em disco irá remodelar permanentemente o mercado de jogos.

A recente decisão da Sony de interromper o lançamento de jogos para seus consoles em…

6 horas atrás

As autoridades indianas exigiram que o Telegram tome medidas decisivas em 15 dias para combater a disseminação de conteúdo pirateado.

Em junho, as autoridades reguladoras indianas já haviam bloqueado temporariamente o Telegram, alegando a necessidade…

7 horas atrás

A NVIDIA disponibilizou discretamente a plataforma Omniverse gratuitamente, mas há um porém.

A NVIDIA anunciou discretamente mudanças no licenciamento da plataforma NVIDIA Omniverse. De acordo com a…

13 horas atrás

Veado e Menino – Uma História Quase Disney. Resenha

Processador Intel Core i5-7400 3.0 GHz / AMD Ryzen 3 1200 3.1 GHz, 16 GB…

13 horas atrás