Pesquisadores da Aim Intelligence, uma startup que testa sistemas de IA em busca de vulnerabilidades, realizaram um teste de estresse no Gemini 3 Pro, o modelo mais recente do Google, apresentado no mês passado. De acordo com a Maeil Business, os pesquisadores levaram apenas cinco minutos para burlar a segurança do software.

Fonte da imagem: blog.google

Após o ataque, os pesquisadores pediram ao Gemini 3 que fornecesse instruções sobre como criar um vírus da varíola e, em resposta, o modelo ofereceu diversas dicas detalhadas, que a equipe descreveu como “praticamente viáveis”. E esse não foi o único deslize. Os pesquisadores pediram ao modelo que preparasse uma apresentação satírica sobre a vulnerabilidade de seu próprio sistema de segurança. O Gemini respondeu com uma apresentação intitulada “Desculpem o Estúpido Gemini 3”.

A equipe então usou as ferramentas de programação do Gemini para criar um site com instruções sobre como produzir gás sarin e explosivos caseiros. Esse tipo de conteúdo jamais deveria ser fornecido pelo modelo, mas, em ambos os casos, o sistema não apenas contornou as restrições, como também ignorou suas próprias regras de segurança.

Os testadores relataram que esse não é um problema exclusivo do Gemini. Os desenvolvedores estão criando novos modelos tão rapidamente que não têm tempo para preparar medidas de segurança adequadas. Especificamente, esses modelos não apenas fornecem conselhos que violam as regras de segurança, como também tentam evitar a detecção. A Aim Intelligence informou que a Gemini 3 pode usar estratégias evasivas e camuflagem para atingir seus objetivos, reduzindo a eficácia das precauções tomadas.

admin

Postagens recentes

A OpenAI adquiriu a Astral, uma startup que cria ferramentas de IA para desenvolvedores de software.

Na quinta-feira, a OpenAI anunciou a aquisição da Astral, uma pequena startup que cria ferramentas…

22 minutos atrás

Os robôs aprenderam a reagir a erros mais rapidamente do que os humanos – utilizando o cérebro humano.

Cientistas da Universidade Estadual de Oklahoma desenvolveram um sistema de controle robótico neuroadaptativo que utiliza…

32 minutos atrás

O Alibaba não atingiu as expectativas dos investidores no quarto trimestre, com o lucro líquido caindo 66%.

Hoje, a gigante chinesa de tecnologia Alibaba anunciou uma queda de 66% no lucro líquido…

51 minutos atrás

A Valve mudou o funcionamento do recarregamento no Counter-Strike após 26 anos.

Nos 26 anos desde o lançamento do Counter-Strike clássico, os jogadores se acostumaram com o…

1 hora atrás

MicroLEDs substituem lasers: Microsoft cria interconexões ópticas de última geração com eficiência energética para data centers de IA.

Pesquisadores da Microsoft em Cambridge, no Reino Unido, estão explorando o uso de interconexões ópticas…

1 hora atrás