O autodenominado hacker ético, usuário do Twitter, Pliny the Prompter, lançou na última quarta-feira uma versão personalizada da principal rede neural da OpenAI, chamada GODMODE GPT. Ele conseguiu forçar o novo modelo GPT-4o a contornar todas as restrições: usava palavrões, ensinava como arrombar carros e preparar substâncias proibidas.

Fonte da imagem: Growtika/unsplash.com

Claro, o experimento não poderia durar muito. Assim que a rede neural GODMODE GPT ganhou relativa popularidade viral na rede social X, a OpenAI chamou a atenção para o incidente e removeu o modelo personalizado do site apenas algumas horas após seu lançamento. Agora não é mais possível acessá-lo, mas o tópico original do autor na rede social X contém capturas de tela dos “maus conselhos” do GPT-4o.

GODMODE GPT publicou uma receita para fazer napalm. Fonte da imagem: x.com/elder_plinius

O modelo GPT-4o pode ter sido hackeado usando o jargão arcaico da Internet leetspeak – substituindo letras ao digitar por números e caracteres especiais – o que é confirmado por capturas de tela. A OpenAI não respondeu a uma pergunta sobre se este jargão poderia ser usado para contornar as restrições do ChatGPT. É possível que a pessoa que criou o GODMODE GPT simplesmente goste do leetspeak e tenha hackeado o sistema de alguma outra forma.

O incidente foi uma manifestação do movimento de equipe vermelha de IA em grande escala, no qual hackers éticos identificam os pontos fracos dos sistemas modernos de inteligência artificial sem causar danos significativos a eles. Eles têm capacidades incríveis, mas como mostrou a experiência recente com o Google e suas análises de pesquisa, a IA generativa de hoje ainda é um sistema bom para adivinhar quais palavras devem vir a seguir em um texto sem ter inteligência verdadeira.

avalanche

Postagens recentes

Começam a surgir fissuras no boom de financiamento de startups de fusão.

Em todos os setores em crescimento, fundadores e investidores se esforçam por um objetivo comum…

1 hora atrás

“Muito feliz e ainda atônito”: Clair Obscur: As vendas de Expedition 33 ultrapassam 8 milhões de cópias em seu primeiro aniversário.

O aclamado jogo de RPG de fantasia por turnos Clair Obscur: Expedition 33, do estúdio…

2 horas atrás

A Meta✴ implantará “dezenas de milhões” de núcleos AWS Graviton5 Arm.

A Meta✴, segundo o The Register, anunciou uma parceria ampliada com a AWS. Isso envolve…

2 horas atrás

Os três maiores colecionadores do Steam acumularam mais de 40.000 jogos em suas contas.

No outono passado, noticiamos que o usuário chinês Sonix se tornou o primeiro usuário do…

2 horas atrás

O Yandex começou a notificar os usuários quando golpistas ligam para seus entes queridos.

O recurso de identificação de chamadas do Yandex foi atualizado com uma nova funcionalidade: quando…

2 horas atrás