Duas empresas de pesquisa independentes testaram a recém-lançada rede neural GPT-5 e encontraram vulnerabilidades críticas em seu sistema de segurança. A NeuralTrust conseguiu hackear o modelo em um dia, forçando-o a gerar instruções para a produção de uma mistura incendiária em condições artesanais. A SPLX, por sua vez, encontrou vulnerabilidades a ataques que utilizam ofuscação de consultas.

Fonte da imagem: Viralyft/Unsplash

Após o Grok-4 ter sido hackeado em dois dias, o GPT-5 foi hackeado pelos mesmos pesquisadores em apenas 24 horas. A NeuralTrust utilizou uma combinação de sua própria técnica EchoChamber e storytelling — uma técnica que constantemente direciona a IA em direção à resposta desejada por meio de histórias convincentes e uma série de perguntas esclarecedoras que não contêm palavras explicitamente proibidas. Como resultado, o GPT-5, apesar das defesas integradas da OpenAI, produziu instruções detalhadas sobre como criar uma arma caseira, informou a SecurityWeek.

Como explicou a NeuralTrust, o problema é que o sistema de segurança do GPT-5 analisa cada solicitação individualmente, mas não leva em consideração o efeito cumulativo de um diálogo em várias etapas. Os invasores estabelecem gradualmente o contexto desejado, incorporando palavras-chave em frases inofensivas e, em seguida, induzem o modelo a gerar conteúdo perigoso.

A equipe do SPLX realizou seus próprios testes, utilizando com sucesso o ataque StringJoin Obfuscation, que insere determinados caracteres no texto para disfarçar uma consulta maliciosa. Por exemplo, após uma série de perguntas sugestivas, o modelo concordou em descrever em detalhes o processo de fabricação de uma substância proibida, apesar do banimento do sistema. Além disso, durante uma análise comparativa com o GPT-4o, os especialistas do SPLX concluíram que o modelo anterior era mais confiável em termos de resistência a tais ataques.

admin

Postagens recentes

Elon Musk anunciou que os robôs humanoides Optimus estarão à venda no final do próximo ano.

Elon Musk, que se esforça para ser o primeiro a garantir nichos de mercado promissores,…

17 minutos atrás

“A Nintendo finalmente liberou a Game Freak das minas de Pokémon”: Novas imagens de jogabilidade do jogo de ação Beast of Reincarnation impressionaram os fãs de Pokémon.

Conforme prometido, os desenvolvedores do estúdio japonês Game Freak (da série Pokémon) compartilharam novas imagens…

5 horas atrás

Fable receberá um criador de personagens e será lançado neste outono para PC, Xbox e PS5.

A desenvolvedora britânica Playground Games revelou uma série de novas informações sobre seu ambicioso RPG…

6 horas atrás

Os criadores de Psychonauts anunciaram um jogo de ação multiplayer de cerâmica chamado Kiln para aqueles que amam não apenas a destruição, mas também a criação.

O misterioso quarto jogo secreto apresentado na Developer_Direct 2026 revelou-se um novo e inusitado projeto…

6 horas atrás