Categorias: Mercado de tecnologia e TI. notíciaVírus, cavalos de Troia, vulnerabilidades de software, problemas de segurança

O hacker forçou o GPT-4o a funcionar no “modo deus” – sem nenhuma restrição

O autodenominado hacker ético, usuário do Twitter, Pliny the Prompter, lançou na última quarta-feira uma versão personalizada da principal rede neural da OpenAI, chamada GODMODE GPT. Ele conseguiu forçar o novo modelo GPT-4o a contornar todas as restrições: usava palavrões, ensinava como arrombar carros e preparar substâncias proibidas.

Fonte da imagem: Growtika/unsplash.com

Claro, o experimento não poderia durar muito. Assim que a rede neural GODMODE GPT ganhou relativa popularidade viral na rede social X, a OpenAI chamou a atenção para o incidente e removeu o modelo personalizado do site apenas algumas horas após seu lançamento. Agora não é mais possível acessá-lo, mas o tópico original do autor na rede social X contém capturas de tela dos “maus conselhos” do GPT-4o.

GODMODE GPT publicou uma receita para fazer napalm. Fonte da imagem: x.com/elder_plinius

O modelo GPT-4o pode ter sido hackeado usando o jargão arcaico da Internet leetspeak – substituindo letras ao digitar por números e caracteres especiais – o que é confirmado por capturas de tela. A OpenAI não respondeu a uma pergunta sobre se este jargão poderia ser usado para contornar as restrições do ChatGPT. É possível que a pessoa que criou o GODMODE GPT simplesmente goste do leetspeak e tenha hackeado o sistema de alguma outra forma.

O incidente foi uma manifestação do movimento de equipe vermelha de IA em grande escala, no qual hackers éticos identificam os pontos fracos dos sistemas modernos de inteligência artificial sem causar danos significativos a eles. Eles têm capacidades incríveis, mas como mostrou a experiência recente com o Google e suas análises de pesquisa, a IA generativa de hoje ainda é um sistema bom para adivinhar quais palavras devem vir a seguir em um texto sem ter inteligência verdadeira.

avalanche

Próximo Telegram adicionou mensagens com efeitos animados, hashtags globais e outras inovações »

Anterior « Novos satélites Starlink podem destruir a radioastronomia da Terra, alertam cientistas

Deixar comentário

Publicado por

avalanche

2 anos atrás

Postagens recentes

Jogos

State of Decay 3 ressuscitou e está se preparando para um alfa público seis anos após seu anúncio.

O estúdio americano Undead Labs, parte da Xbox Game Studios, divulgou as primeiras notícias em…

43 minutos atrás

Notícias da rede

O modelo de IA Claude descobriu uma vulnerabilidade e desenvolveu um exploit funcional para o FreeBSD.

O modelo de IA Claude, em conjunto com o pesquisador Nicholas Carlini, criou autonomamente dois…

2 horas atrás

Monitores, projetores, sintonizadores de TV, televisões

A Asus economizou na embalagem, fazendo com que monitores OLED de US$ 1.299 chegassem rachados.

O Asus ROG Swift OLED PG32UCDM Gen3 (PG32UCDM3) é um dos melhores e mais caros…

2 horas atrás

Consoles de jogos

Um entusiasta japonês conseguiu conectar um SSD M.2 ao console Switch 2 através do slot microSD Express.

Um modder japonês demonstrou um método funcional para conectar um SSD M.2 NVMe a um…

2 horas atrás

Jogos

O RPG de fantasia Songs of Glimmerwick leva você a um mundo onde a magia nasce da música — novo trailer, lançamento em 2026 e demo em breve.

A desenvolvedora americana Eastshade Studios (Eastshade) revelou o primeiro trailer inédito de seu jogo de…

2 horas atrás

Notícias da rede

O Google, a Meta e outras grandes empresas de tecnologia não poderão mais se esquivar da responsabilidade pelo conteúdo dos usuários, como fizeram durante 30 anos.

Meta e Google, que dominam o mercado de publicidade digital dos EUA, têm sido alvo…

2 horas atrás

O hacker forçou o GPT-4o a funcionar no “modo deus” – sem nenhuma restrição

Conteúdo relacionado

Postagens recentes

State of Decay 3 ressuscitou e está se preparando para um alfa público seis anos após seu anúncio.

O modelo de IA Claude descobriu uma vulnerabilidade e desenvolveu um exploit funcional para o FreeBSD.

A Asus economizou na embalagem, fazendo com que monitores OLED de US$ 1.299 chegassem rachados.

Um entusiasta japonês conseguiu conectar um SSD M.2 ao console Switch 2 através do slot microSD Express.

O RPG de fantasia Songs of Glimmerwick leva você a um mundo onde a magia nasce da música — novo trailer, lançamento em 2026 e demo em breve.

O Google, a Meta e outras grandes empresas de tecnologia não poderão mais se esquivar da responsabilidade pelo conteúdo dos usuários, como fizeram durante 30 anos.