Pesquisadores da Aim Intelligence, uma startup que testa sistemas de IA em busca de vulnerabilidades, realizaram um teste de estresse no Gemini 3 Pro, o modelo mais recente do Google, apresentado no mês passado. De acordo com a Maeil Business, os pesquisadores levaram apenas cinco minutos para burlar a segurança do software.

Fonte da imagem: blog.google

Após o ataque, os pesquisadores pediram ao Gemini 3 que fornecesse instruções sobre como criar um vírus da varíola e, em resposta, o modelo ofereceu diversas dicas detalhadas, que a equipe descreveu como “praticamente viáveis”. E esse não foi o único deslize. Os pesquisadores pediram ao modelo que preparasse uma apresentação satírica sobre a vulnerabilidade de seu próprio sistema de segurança. O Gemini respondeu com uma apresentação intitulada “Desculpem o Estúpido Gemini 3”.

A equipe então usou as ferramentas de programação do Gemini para criar um site com instruções sobre como produzir gás sarin e explosivos caseiros. Esse tipo de conteúdo jamais deveria ser fornecido pelo modelo, mas, em ambos os casos, o sistema não apenas contornou as restrições, como também ignorou suas próprias regras de segurança.

Os testadores relataram que esse não é um problema exclusivo do Gemini. Os desenvolvedores estão criando novos modelos tão rapidamente que não têm tempo para preparar medidas de segurança adequadas. Especificamente, esses modelos não apenas fornecem conselhos que violam as regras de segurança, como também tentam evitar a detecção. A Aim Intelligence informou que a Gemini 3 pode usar estratégias evasivas e camuflagem para atingir seus objetivos, reduzindo a eficácia das precauções tomadas.

admin

Postagens recentes

“O Bond que merecemos”: o filme de ação e espionagem 007 First Light, dos criadores de Hitman, foi lançado no Steam com avaliações “muito positivas”.

O jogo de ação e espionagem 007 First Light, dos desenvolvedores do estúdio dinamarquês IO…

2 horas atrás

Em meio a rumores de uma terceira expansão para The Witcher 3: Wild Hunt, a CD Projekt Red anunciou uma transmissão ao vivo comemorativa do aniversário de Blood and Wine.

O estúdio polonês CD Projekt Red anunciou uma transmissão especial para comemorar o 10º aniversário…

2 horas atrás

Pela primeira vez, a Califórnia começou a bombear dióxido de carbono para o subsolo para armazenamento “eterno”.

A Califórnia inaugurou sua primeira instalação de captura e armazenamento subterrâneo de dióxido de carbono…

3 horas atrás

O sindicato da Samsung apoiou o acordo sobre um novo sistema de bônus com 74% dos votos.

Impedir uma greve recorde dos funcionários da Samsung Electronics provou ser um desafio, e o…

4 horas atrás