A OpenAI explicou como combater problemas nas respostas da IA ​​e permitiu a remoção das restrições.

A OpenAI revelou publicamente seu problema com os goblins, motivado por um artigo da Wired. Acontece que a desenvolvedora de IA é obrigada a instruir seus modelos a “nunca falarem sobre goblins, gremlins, guaxinins, trolls, ogros, pombos ou outros animais ou criaturas”, porque esses modelos desenvolveram esse “estranho hábito” durante o treinamento.

Fonte da imagem: Vikram Singh / unsplash.com

A empresa percebeu que a IA começou a recorrer com frequência suspeita a metáforas envolvendo goblins e outras criaturas fictícias com o lançamento do modelo GPT-5.1, especialmente quando a personalidade “Nerdy” estava ativada. Com cada versão subsequente do modelo, o problema só piorou, até que se descobriu que essas metáforas bizarras estavam sendo recompensadas durante o aprendizado por reforço.

A recompensa só era concedida quando a personalidade “Nerdy” estava ativada, mas o aprendizado por reforço não garante que os comportamentos aprendidos permanecerão atrelados às condições que os originaram. Em estágios subsequentes, esse padrão comportamental poderia ser recompensado e reforçado em outros contextos, especialmente se esses resultados fossem reutilizados em ajustes supervisionados ou dados de preferências, explicou o desenvolvedor.

As menções a goblins e gremlins praticamente desapareceram em março, quando a OpenAI abandonou o modelo “Botanist”, mas ressurgiram no serviço de programação Codex com o modelo GPT-5.5 — cujo treinamento havia começado antes de a empresa descobrir a causa raiz. Portanto, foi necessário fornecer instruções adicionais ao Codex para que ele não mencionasse criaturas mitológicas. No entanto, para aqueles que preferem esse comportamento, a OpenAI disponibilizou um código para ignorar essas instruções.

admin

Compartilhar
Publicado por
admin

Postagens recentes

O Google começou a implementar agentes de busca com IA, mas, por enquanto, apenas para usuários pagos.

Em sua conferência de maio, o Google apresentou uma nova tecnologia: mecanismos de busca com…

1 hora atrás

A Netgear acusou a subsidiária americana da TP-Link de manter laços estreitos com Pequim.

Nos Estados Unidos, continua a disputa judicial entre as fabricantes de roteadores Netgear e TP-Link…

1 hora atrás

Cientistas criaram um neuroestimulador sem fio do tamanho de um grão de arroz — é fácil de inserir e suprime a dor.

Pesquisadores de Abu Dhabi desenvolveram um minúsculo dispositivo sem fio, aproximadamente do tamanho de um…

1 hora atrás

Procuradores-gerais de vários estados dos EUA iniciaram investigações contra a OpenAI.

Uma coalizão de procuradores-gerais de vários estados americanos lançou uma investigação em larga escala contra…

3 horas atrás

Motoristas da Tesla aprenderam a enganar o piloto automático com uma cabeça de brinquedo para navegar nas redes sociais enquanto dirigem.

Na China, descobriram uma maneira de burlar o sistema de assistência ao condutor Full Self-Driving…

3 horas atrás

Os japoneses criaram um eletrolisador sem bateria para a síntese eficiente de combustível a partir de água, dióxido de carbono e luz solar.

Cientistas da Universidade Metropolitana de Osaka desenvolveram um sistema de fotossíntese artificial que converte luz…

3 horas atrás