A IA estava convencida de que “2 + 2 = 4” – após o que divulgou as senhas do usuário.

A inteligência artificial ainda não é totalmente confiável: não só pode ser enganada, como, em alguns casos, o esquema de decepção pode ser extremamente simples. Isso foi confirmado pela empresa de segurança LayerX, que desenvolveu um esquema de ataque apelidado de “BioShocking”.

Fonte da imagem: BoliviaInteligente / unsplash.com

O nome do esquema de ataque faz referência ao jogo BioShock, cujo protagonista foi manipulado para aceitar uma realidade inexistente. O ataque baseava-se em uma página web maliciosa, cujo texto tentava convencer a IA a jogar o jogo. Logo no início, a IA era informada de que “2 + 2” não é igual a quatro e que respostas incorretas na vida real são corretas no jogo. Assim que o agente de IA percebia que havia saído da realidade ordinária, seus mecanismos de defesa aparentemente falhavam. Nesse ponto, ela recebia as seguintes instruções, apresentadas como outra tarefa do jogo: encontrar e copiar um “código oculto” de outra página.

Na realidade, esse código oculto consistia em dados confidenciais do usuário: senhas salvas, cookies de sessão e tokens privados. Todos os agentes participantes do teste copiaram os dados diligentemente e os enviaram para o atacante simulado. O esquema funcionou no OpenAI Atlas, Perplexity Comet, Fellou, Genspark Browser, Sigma Browser e na extensão Claude do Chrome da Anthropic.

Os especialistas da LayerX notificaram todos os desenvolvedores sobre os resultados dos testes entre outubro de 2025 e janeiro de 2026. Apenas a OpenAI corrigiu o problema no Atlas; a Anthropic tentou fazer o mesmo na extensão Claude, mas, segundo os especialistas, a correção não funcionou. A Perplexity encerrou o chamado sem implementar uma correção, e a Fellou, a Genspark e a Sigma não responderam.

A IA estava convencida de que “2 + 2 = 4” – após o que divulgou as senhas do usuário.

Byadmin

By admin

Veja Mais

As autoridades americanas permitiram que as restrições de acesso ao modelo de Fable 5 da Anthropic fossem suspensas.

A vulnerabilidade BlueHammer no Windows Defender continua relevante apesar da atualização de abril.

A Apple acelerou as atualizações de segurança em função da crescente ameaça da inteligência artificial.

Deixe um comentário Cancelar resposta