A OpenAI explicou como combater problemas nas respostas da IA ​​e permitiu a remoção das restrições.

A OpenAI revelou publicamente seu problema com os goblins, motivado por um artigo da Wired. Acontece que a desenvolvedora de IA é obrigada a instruir seus modelos a “nunca falarem sobre goblins, gremlins, guaxinins, trolls, ogros, pombos ou outros animais ou criaturas”, porque esses modelos desenvolveram esse “estranho hábito” durante o treinamento.

Fonte da imagem: Vikram Singh / unsplash.com

A empresa percebeu que a IA começou a recorrer com frequência suspeita a metáforas envolvendo goblins e outras criaturas fictícias com o lançamento do modelo GPT-5.1, especialmente quando a personalidade “Nerdy” estava ativada. Com cada versão subsequente do modelo, o problema só piorou, até que se descobriu que essas metáforas bizarras estavam sendo recompensadas durante o aprendizado por reforço.

A recompensa só era concedida quando a personalidade “Nerdy” estava ativada, mas o aprendizado por reforço não garante que os comportamentos aprendidos permanecerão atrelados às condições que os originaram. Em estágios subsequentes, esse padrão comportamental poderia ser recompensado e reforçado em outros contextos, especialmente se esses resultados fossem reutilizados em ajustes supervisionados ou dados de preferências, explicou o desenvolvedor.

As menções a goblins e gremlins praticamente desapareceram em março, quando a OpenAI abandonou o modelo “Botanist”, mas ressurgiram no serviço de programação Codex com o modelo GPT-5.5 — cujo treinamento havia começado antes de a empresa descobrir a causa raiz. Portanto, foi necessário fornecer instruções adicionais ao Codex para que ele não mencionasse criaturas mitológicas. No entanto, para aqueles que preferem esse comportamento, a OpenAI disponibilizou um código para ignorar essas instruções.

admin

Compartilhar
Publicado por
admin

Postagens recentes

A Samsung evitou uma greve que poderia ter aumentado os preços da memória, graças a bônus maiores concedidos aos trabalhadores.

O sindicato dos trabalhadores da Samsung Electronics anunciou a suspensão da greve que começaria na…

37 minutos atrás

O AM4 está vivo! O Ryzen 7 5800X3D AM4 Edição de 10º Aniversário já está disponível na Índia por US$ 310.

O processador Ryzen 7 5800X3D, o retorno da AMD ao mercado para celebrar o 10º…

1 hora atrás

Cientistas chineses conseguiram, pela primeira vez na história, alimentar diversos alvos aéreos com um feixe de micro-ondas.

A China, assim como outros países, está explorando a possibilidade de coletar energia solar em…

1 hora atrás

Founders Edition, mas não da Nvidia: a chinesa Lisuan Tech apresentou a placa gráfica para jogos LX 7G100 em um design de referência.

A Lisuan Tech está se preparando para o lançamento comercial de sua placa de vídeo…

1 hora atrás

A Embracer confirmou a data de lançamento do próximo jogo da Warhorse Studios – o novo Kingdom Come poderá ser lançado já em 2027.

Confirmado pelos desenvolvedores do estúdio tcheco Warhorse Studios (pertencente ao Embracer Group), o novo jogo…

2 horas atrás

Hackers vazaram dados de clientes da Trump Mobile e revelaram as vendas reais do smartphone T1.

Antes do lançamento do infame smartphone Trump Mobile T1, começaram a surgir relatos de vazamentos…

3 horas atrás