Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

A OpenAI explicou como combater problemas nas respostas da IA e permitiu a remoção das restrições.

A OpenAI revelou publicamente seu problema com os goblins, motivado por um artigo da Wired. Acontece que a desenvolvedora de IA é obrigada a instruir seus modelos a “nunca falarem sobre goblins, gremlins, guaxinins, trolls, ogros, pombos ou outros animais ou criaturas”, porque esses modelos desenvolveram esse “estranho hábito” durante o treinamento.

Fonte da imagem: Vikram Singh / unsplash.com

A empresa percebeu que a IA começou a recorrer com frequência suspeita a metáforas envolvendo goblins e outras criaturas fictícias com o lançamento do modelo GPT-5.1, especialmente quando a personalidade “Nerdy” estava ativada. Com cada versão subsequente do modelo, o problema só piorou, até que se descobriu que essas metáforas bizarras estavam sendo recompensadas durante o aprendizado por reforço.

A recompensa só era concedida quando a personalidade “Nerdy” estava ativada, mas o aprendizado por reforço não garante que os comportamentos aprendidos permanecerão atrelados às condições que os originaram. Em estágios subsequentes, esse padrão comportamental poderia ser recompensado e reforçado em outros contextos, especialmente se esses resultados fossem reutilizados em ajustes supervisionados ou dados de preferências, explicou o desenvolvedor.

As menções a goblins e gremlins praticamente desapareceram em março, quando a OpenAI abandonou o modelo “Botanist”, mas ressurgiram no serviço de programação Codex com o modelo GPT-5.5 — cujo treinamento havia começado antes de a empresa descobrir a causa raiz. Portanto, foi necessário fornecer instruções adicionais ao Codex para que ele não mencionasse criaturas mitológicas. No entanto, para aqueles que preferem esse comportamento, a OpenAI disponibilizou um código para ignorar essas instruções.

admin

Próximo Um funcionário da Warner Bros. Games revelou que o próximo jogo dos criadores de Mortal Kombat será Injustice 3. »

Anterior « Os cientistas estão perto de desvendar o mistério dos "pequenos pontos vermelhos" nas profundezas do Universo: o telescópio Webb detectou indícios da presença de um buraco negro próximo a um deles.

Deixar comentário

Publicado por

admin

2 meses atrás

Postagens recentes

Carros, motos, veículos

A participação da Tesla no mercado global de veículos elétricos fabricados na China caiu para menos de 30% das remessas pela primeira vez desde 2020.

A fábrica da Tesla em Xangai é única não apenas por ter sido construída em…

2 horas atrás

O mundo da robótica

Os robôs ainda têm muito espaço para melhorar antes de se tornarem vizinhos seguros para os humanos.

Os desenvolvedores de robôs humanoides estão ansiosos para demonstrar progressos significativos em seu desenvolvimento, mas,…

3 horas atrás

Notícias da rede

A decisão da Sony de parar de lançar jogos em disco irá remodelar permanentemente o mercado de jogos.

A recente decisão da Sony de interromper o lançamento de jogos para seus consoles em…

4 horas atrás

Clientes de MI

As autoridades indianas exigiram que o Telegram tome medidas decisivas em 15 dias para combater a disseminação de conteúdo pirateado.

Em junho, as autoridades reguladoras indianas já haviam bloqueado temporariamente o Telegram, alegando a necessidade…

4 horas atrás

A NVIDIA disponibilizou discretamente a plataforma Omniverse gratuitamente, mas há um porém.

A NVIDIA anunciou discretamente mudanças no licenciamento da plataforma NVIDIA Omniverse. De acordo com a…

11 horas atrás

Consoles de jogos

Veado e Menino – Uma História Quase Disney. Resenha

Processador Intel Core i5-7400 3.0 GHz / AMD Ryzen 3 1200 3.1 GHz, 16 GB…