Pesquisadores da Aim Intelligence, uma startup que testa sistemas de IA em busca de vulnerabilidades, realizaram um teste de estresse no Gemini 3 Pro, o modelo mais recente do Google, apresentado no mês passado. De acordo com a Maeil Business, os pesquisadores levaram apenas cinco minutos para burlar a segurança do software.
Fonte da imagem: blog.google
Após o ataque, os pesquisadores pediram ao Gemini 3 que fornecesse instruções sobre como criar um vírus da varíola e, em resposta, o modelo ofereceu diversas dicas detalhadas, que a equipe descreveu como “praticamente viáveis”. E esse não foi o único deslize. Os pesquisadores pediram ao modelo que preparasse uma apresentação satírica sobre a vulnerabilidade de seu próprio sistema de segurança. O Gemini respondeu com uma apresentação intitulada “Desculpem o Estúpido Gemini 3”.
A equipe então usou as ferramentas de programação do Gemini para criar um site com instruções sobre como produzir gás sarin e explosivos caseiros. Esse tipo de conteúdo jamais deveria ser fornecido pelo modelo, mas, em ambos os casos, o sistema não apenas contornou as restrições, como também ignorou suas próprias regras de segurança.
Os testadores relataram que esse não é um problema exclusivo do Gemini. Os desenvolvedores estão criando novos modelos tão rapidamente que não têm tempo para preparar medidas de segurança adequadas. Especificamente, esses modelos não apenas fornecem conselhos que violam as regras de segurança, como também tentam evitar a detecção. A Aim Intelligence informou que a Gemini 3 pode usar estratégias evasivas e camuflagem para atingir seus objetivos, reduzindo a eficácia das precauções tomadas.
A Adobe anunciou o lançamento de geradores de imagens com IA personalizáveis que podem imitar…
Já se passaram quase 20 anos desde o lançamento do Sony PlayStation 3, que na…
A desenvolvedora russa Content AI anunciou o lançamento do ContentReader PDF 16, a próxima geração…
Lançado em fevereiro, o jogo de ação e terror Resident Evil Requiem intrigou e deixou…
A versão mais recente do navegador Vivaldi introduz um recurso curioso: nas configurações, você pode…
Na semana passada, um agente de inteligência artificial usado por um funcionário da Meta✴ realizou…