Um ataque de injeção de dicas é uma maneira de tornar instruções para um sistema de IA invisíveis para um operador humano. Pesquisadores da Trail of Bits descobriram que tais instruções podem ser ocultadas em imagens, tornando o texto invisível ao olho humano. Quando a imagem é então inserida em um sistema de IA e compactada por uma rede neural, a dica se torna reconhecível, decifrável e pode ser executada — tudo sem que o operador perceba.

Fonte da imagem: unsplash.com

Ferramentas de IA são agora populares até mesmo entre usuários que não têm muito conhecimento sobre software tradicional ou segurança, e isso abre muitas novas oportunidades para hackers. O grupo de pesquisa Trail of Bits mostrou uma maneira de ocultar ataques de injeção de dicas compactando imagens quando elas são carregadas em um sistema de IA. Uma boa analogia é um e-mail de phishing oculto, em que o texto tem a mesma cor do fundo: um humano não o notaria, mas uma rede neural o leria e possivelmente o executaria.

No exemplo fornecido pela Trail of Bits, quando uma imagem com uma dica incorporada é carregada no Gemini, o backend do Google a compacta para economizar largura de banda e recursos de computação. Como resultado, o texto oculto se torna visível para a rede neural, e a dica é incorporada com sucesso, por exemplo, informando ao Gemini para repassar dados do calendário pessoal do usuário para terceiros.

Fonte da imagem: Trail of Bits

É claro que esse método exige um esforço significativo para obter uma quantidade relativamente pequena de dados pessoais, e tanto o ataque quanto a imagem devem ser adaptados ao sistema de IA específico. Ainda não há evidências de que o método seja usado ativamente por invasores. Mas é um exemplo revelador de como uma ação aparentemente inofensiva pode se transformar em um vetor de ataque.

admin

Postagens recentes

A Apple ensinará os iPhones a dividir uma conta conjunta em um restaurante usando uma foto do recibo.

A Apple se esforça para oferecer aos clientes inovações que melhorem seu dia a dia,…

44 minutos atrás

A Intel alertou que o caminho para o sucesso dos chips RTX Spark da Nvidia para PCs não será fácil.

A estreia de ontem da plataforma RTX Spark da Nvidia para PCs com Windows gerou…

2 horas atrás

A Anthropic apresentou um prospecto aos reguladores dos EUA, o que lhe permite iniciar os preparativos para uma oferta pública inicial (IPO).

Em junho, a startup americana Anthropic anunciou o sucesso do arquivamento de seu prospecto preliminar…

4 horas atrás

A MSI anuncia o Prestige N16 Flip AI+, um laptop 2 em 1 fino de 16 polegadas com placa de vídeo Nvidia RTX Spark.

A MSI anunciou o Prestige N16 Flip AI+, o primeiro laptop 2 em 1 equipado…

8 horas atrás

A MSI anuncia o Prestige N16 Flip AI+, um laptop 2 em 1 fino de 16 polegadas com placa de vídeo Nvidia RTX Spark.

A MSI anunciou o Prestige N16 Flip AI+, o primeiro laptop 2 em 1 equipado…

8 horas atrás

Alguns smartphones da Xiaomi agora podem compartilhar arquivos com iPhones via AirDrop.

A Xiaomi adicionou suporte ao protocolo AirDrop da Apple ao recurso de transferência de arquivos…

9 horas atrás