Um ataque de injeção de dicas é uma maneira de tornar instruções para um sistema de IA invisíveis para um operador humano. Pesquisadores da Trail of Bits descobriram que tais instruções podem ser ocultadas em imagens, tornando o texto invisível ao olho humano. Quando a imagem é então inserida em um sistema de IA e compactada por uma rede neural, a dica se torna reconhecível, decifrável e pode ser executada — tudo sem que o operador perceba.

Fonte da imagem: unsplash.com

Ferramentas de IA são agora populares até mesmo entre usuários que não têm muito conhecimento sobre software tradicional ou segurança, e isso abre muitas novas oportunidades para hackers. O grupo de pesquisa Trail of Bits mostrou uma maneira de ocultar ataques de injeção de dicas compactando imagens quando elas são carregadas em um sistema de IA. Uma boa analogia é um e-mail de phishing oculto, em que o texto tem a mesma cor do fundo: um humano não o notaria, mas uma rede neural o leria e possivelmente o executaria.

No exemplo fornecido pela Trail of Bits, quando uma imagem com uma dica incorporada é carregada no Gemini, o backend do Google a compacta para economizar largura de banda e recursos de computação. Como resultado, o texto oculto se torna visível para a rede neural, e a dica é incorporada com sucesso, por exemplo, informando ao Gemini para repassar dados do calendário pessoal do usuário para terceiros.

Fonte da imagem: Trail of Bits

É claro que esse método exige um esforço significativo para obter uma quantidade relativamente pequena de dados pessoais, e tanto o ataque quanto a imagem devem ser adaptados ao sistema de IA específico. Ainda não há evidências de que o método seja usado ativamente por invasores. Mas é um exemplo revelador de como uma ação aparentemente inofensiva pode se transformar em um vetor de ataque.

admin

Postagens recentes

Armênia receberá mais 41.000 placas de vídeo NVIDIA GB300 para o data center de IA Firebird, em um investimento de US$ 4 bilhões.

A Firebird, empresa americana especializada em soluções de infraestrutura de nuvem e IA, anunciou a…

14 minutos atrás

O Instagram e o TikTok concordaram voluntariamente em passar por uma avaliação de segurança para adolescentes.

Especialistas em saúde mental desenvolveram um sistema que inclui duas dezenas de padrões para avaliar…

29 minutos atrás

Sistemas de inteligência artificial (IA) médicos podem facilmente fornecer conselhos prejudiciais se os sintomas forem descritos de forma inteligente.

Os modernos modelos de linguagem de grande escala (LLMs, na sigla em inglês) usados ​​na…

40 minutos atrás

Cientistas chineses criaram baterias semi-sólidas capazes de suportar temperaturas tão baixas quanto -34°C.

Já se sabe, por notícias relevantes, que uma maneira de criar baterias resistentes ao congelamento…

40 minutos atrás

A ByteDance está desenvolvendo um chip de IA proprietário, com produção planejada para a Samsung.

Grandes empresas de IA estão demonstrando crescente interesse no desenvolvimento de seus próprios aceleradores de…

40 minutos atrás