Categorias: Mercado de tecnologia e TI. notíciaVírus, cavalos de Troia, vulnerabilidades de software, problemas de segurança

O hacker forçou o GPT-4o a funcionar no “modo deus” – sem nenhuma restrição

O autodenominado hacker ético, usuário do Twitter, Pliny the Prompter, lançou na última quarta-feira uma versão personalizada da principal rede neural da OpenAI, chamada GODMODE GPT. Ele conseguiu forçar o novo modelo GPT-4o a contornar todas as restrições: usava palavrões, ensinava como arrombar carros e preparar substâncias proibidas.

Fonte da imagem: Growtika/unsplash.com

Claro, o experimento não poderia durar muito. Assim que a rede neural GODMODE GPT ganhou relativa popularidade viral na rede social X, a OpenAI chamou a atenção para o incidente e removeu o modelo personalizado do site apenas algumas horas após seu lançamento. Agora não é mais possível acessá-lo, mas o tópico original do autor na rede social X contém capturas de tela dos “maus conselhos” do GPT-4o.

GODMODE GPT publicou uma receita para fazer napalm. Fonte da imagem: x.com/elder_plinius

O modelo GPT-4o pode ter sido hackeado usando o jargão arcaico da Internet leetspeak – substituindo letras ao digitar por números e caracteres especiais – o que é confirmado por capturas de tela. A OpenAI não respondeu a uma pergunta sobre se este jargão poderia ser usado para contornar as restrições do ChatGPT. É possível que a pessoa que criou o GODMODE GPT simplesmente goste do leetspeak e tenha hackeado o sistema de alguma outra forma.

O incidente foi uma manifestação do movimento de equipe vermelha de IA em grande escala, no qual hackers éticos identificam os pontos fracos dos sistemas modernos de inteligência artificial sem causar danos significativos a eles. Eles têm capacidades incríveis, mas como mostrou a experiência recente com o Google e suas análises de pesquisa, a IA generativa de hoje ainda é um sistema bom para adivinhar quais palavras devem vir a seguir em um texto sem ter inteligência verdadeira.

avalanche

Próximo Telegram adicionou mensagens com efeitos animados, hashtags globais e outras inovações »

Anterior « Novos satélites Starlink podem destruir a radioastronomia da Terra, alertam cientistas

Deixar comentário

Publicado por

avalanche

2 anos atrás

Postagens recentes

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

Jornalistas comprovaram que milhões de músicas protegidas por direitos autorais estão sendo usadas para treinar inteligência artificial.

A revista The Atlantic encontrou evidências convincentes do uso de milhões de gravações musicais protegidas…

42 minutos atrás

Jogos

Um modder demonstrou a jogabilidade de Dark Souls 2 com modo cooperativo perfeito, e os jogadores estão entusiasmados.

O modder Yui (também conhecido como LukeYui) compartilhou o progresso do recurso de cooperação perfeita…

1 hora atrás

Vírus, cavalos de Troia, vulnerabilidades de software, problemas de segurança

O Telegram foi removido da Apple App Store e do Google Play na Índia.

A Apple e o Google removeram o aplicativo de mensagens Telegram de suas lojas de…

2 horas atrás

Módulos de RAM, cartões de memória, pen drives, leitores de cartões

A Sandisk definiu o preço do seu SSD Optimus GX PRO 850P de 8 TB para PS5 em quase cinco vezes o preço do próprio console.

A Sandisk anunciou as especificações completas de seu novo SSD Optimus GX PRO 850P PCIe…

3 horas atrás

O mundo da robótica

Uma loja de conveniência 24 horas com um vendedor que utiliza um dispositivo Android será inaugurada em Hong Kong.

Uma pequena loja de conveniência aberta 24 horas por dia abrirá em breve em Hong…

3 horas atrás

Casos, computadores desktop

O pacote completo Asus ROG 20th Anniversary Collection Edition custa US$ 16.580 na China.

A Asus China anunciou os preços de componentes e acessórios para computador lançados para celebrar…

3 horas atrás

O hacker forçou o GPT-4o a funcionar no “modo deus” – sem nenhuma restrição

Conteúdo relacionado

Postagens recentes

Jornalistas comprovaram que milhões de músicas protegidas por direitos autorais estão sendo usadas para treinar inteligência artificial.

Um modder demonstrou a jogabilidade de Dark Souls 2 com modo cooperativo perfeito, e os jogadores estão entusiasmados.

O Telegram foi removido da Apple App Store e do Google Play na Índia.

A Sandisk definiu o preço do seu SSD Optimus GX PRO 850P de 8 TB para PS5 em quase cinco vezes o preço do próprio console.

Uma loja de conveniência 24 horas com um vendedor que utiliza um dispositivo Android será inaugurada em Hong Kong.

O pacote completo Asus ROG 20th Anniversary Collection Edition custa US$ 16.580 na China.