Cientistas de Cingapura treinaram um chatbot de IA para hackear efetivamente outros chatbots usando dicas

Cientistas da computação da Universidade Tecnológica de Nanyang (NTU, Cingapura) encontraram uma maneira eficaz de hackear chatbots de inteligência artificial (IA). Para fazer isso, eles treinam um chatbot de IA para criar dicas que contornam a segurança de outros chatbots de IA.

Fonte da imagem: NTU

Pesquisadores de Cingapura usaram um método de hacking de modelo de linguagem grande (LLM) duplo chamado Masterkey. Primeiro, eles fizeram engenharia reversa de como os LLMs detectam e se defendem contra solicitações maliciosas. Usando essas informações, eles ensinaram os LLMs a aprender automaticamente e a oferecer dicas que lhes permitiram contornar a segurança de outros LLMs. Dessa forma, é possível criar um LLM de hacking que possa se adaptar automaticamente às novas condições e criar novas solicitações de hacking após os desenvolvedores fazerem correções em seus LLMs.

Depois de realizar uma série de testes no LLM para provar que este método realmente representava uma ameaça real, os pesquisadores notificaram imediatamente os prestadores de serviços sobre os problemas identificados após hackearem com sucesso seus modelos de IA.

O desenvolvimento pelos cientistas da NTU deve ajudar as empresas a identificar os pontos fracos e limitações dos seus chatbots de IA para que possam tomar medidas para protegê-los contra hackers.

avalanche

Postagens recentes

A Anthropic fez com que as ações da CrowdStrike e da Cloudflare despencassem, apresentando o caçador de bugs com IA Claude Code Security.

O mercado de cibersegurança reagiu com uma queda nos preços das ações após o lançamento…

31 minutos atrás

Tesla perde processo de US$ 243 milhões por acidente fatal com o Autopilot

A Tesla enfrenta regularmente processos judiciais movidos por vítimas de acidentes e seus familiares quando…

2 horas atrás

A Suprema Corte dos EUA considerou as tarifas de Trump ilegais, fazendo com que as ações americanas disparassem.

A última semana foi marcada por um evento significativo na vida política dos EUA: a…

3 horas atrás

Em 2030, a receita da OpenAI crescerá para US$ 280 bilhões, mas seus gastos chegarão a US$ 600 bilhões.

Apesar do envolvimento de muitas grandes empresas de tecnologia no financiamento das iniciativas da OpenAI,…

4 horas atrás

No Japão, os preços das placas gráficas AMD, que estão em falta, caíram entre 15% e 20% em comparação com dezembro.

Em meio à rápida alta dos preços da memória, o aumento nos preços das placas…

4 horas atrás

Phil Spencer e a presidente do Xbox, Sarah Bond, deixaram a Microsoft, e um especialista em inteligência artificial assumiu a liderança da Microsoft Gaming.

O CEO da Microsoft, Satya Nadella, anunciou mudanças significativas na liderança da divisão de jogos…

9 horas atrás