Pesquisadores da Aim Intelligence, uma startup que testa sistemas de IA em busca de vulnerabilidades, realizaram um teste de estresse no Gemini 3 Pro, o modelo mais recente do Google, apresentado no mês passado. De acordo com a Maeil Business, os pesquisadores levaram apenas cinco minutos para burlar a segurança do software.
Fonte da imagem: blog.google
Após o ataque, os pesquisadores pediram ao Gemini 3 que fornecesse instruções sobre como criar um vírus da varíola e, em resposta, o modelo ofereceu diversas dicas detalhadas, que a equipe descreveu como “praticamente viáveis”. E esse não foi o único deslize. Os pesquisadores pediram ao modelo que preparasse uma apresentação satírica sobre a vulnerabilidade de seu próprio sistema de segurança. O Gemini respondeu com uma apresentação intitulada “Desculpem o Estúpido Gemini 3”.
A equipe então usou as ferramentas de programação do Gemini para criar um site com instruções sobre como produzir gás sarin e explosivos caseiros. Esse tipo de conteúdo jamais deveria ser fornecido pelo modelo, mas, em ambos os casos, o sistema não apenas contornou as restrições, como também ignorou suas próprias regras de segurança.
Os testadores relataram que esse não é um problema exclusivo do Gemini. Os desenvolvedores estão criando novos modelos tão rapidamente que não têm tempo para preparar medidas de segurança adequadas. Especificamente, esses modelos não apenas fornecem conselhos que violam as regras de segurança, como também tentam evitar a detecção. A Aim Intelligence informou que a Gemini 3 pode usar estratégias evasivas e camuflagem para atingir seus objetivos, reduzindo a eficácia das precauções tomadas.
O portal de vistos do Reino Unido disponibilizou publicamente as digitalizações de passaportes e fotos…
Muitos especialistas já expressaram a opinião de que o aumento dos preços dos chips de…
O jogo de ação e espionagem 007 First Light, dos desenvolvedores do estúdio dinamarquês IO…
O estúdio polonês CD Projekt Red anunciou uma transmissão especial para comemorar o 10º aniversário…
A Califórnia inaugurou sua primeira instalação de captura e armazenamento subterrâneo de dióxido de carbono…
Impedir uma greve recorde dos funcionários da Samsung Electronics provou ser um desafio, e o…