Pesquisadores da empresa de segurança da informação Redware publicaram os resultados de sua pesquisa, “Shadow Leak”, na qual usaram o bot de IA ChatGPT como cúmplice para roubar dados confidenciais de caixas de entrada do Gmail. A OpenAI já corrigiu essa vulnerabilidade, mas o simples fato de isso ter sido possível é um bom exemplo dos riscos que os agentes de IA podem representar.

Fonte da imagem: Kevin Ku / Unsplash

Agentes de IA que usam redes neurais para executar ações específicas em nome dos usuários e não exigem supervisão constante têm se tornado cada vez mais comuns. Por exemplo, eles podem navegar em páginas da web e clicar em links. Desenvolvedores de IA promovem ativamente esses serviços, alegando que economizam muito tempo depois que os usuários concedem acesso a seus e-mails, calendários, documentos de trabalho e assim por diante.

Para atingir esse objetivo, os pesquisadores usaram um método chamado “injeção de prompt”, adequado para ataques a sistemas que usam modelos de linguagem de larga escala (LLMs) e que envolve a incorporação de instruções em comandos inseridos pelo usuário para forçar o agente de IA a executar as ações desejadas pelos invasores. A vítima de tal ataque pode não perceber que algo deu errado, pois os comandos do algoritmo podem estar ocultos, por exemplo, escritos em branco sobre um fundo branco.

Como parte do estudo Shadow Leak, os pesquisadores usaram a ferramenta Deep Research, que faz parte do sistema ChatGPT da OpenAI. Eles ofuscaram o texto das instruções maliciosas para o agente de IA e as adicionaram a um e-mail enviado à vítima via Gmail. Na próxima vez que o usuário tentou usar a ferramenta de Pesquisa Profunda, inadvertidamente caiu em uma armadilha. Ao analisar a correspondência recebida, o agente de IA encontrou novas instruções que o instruíam a encontrar todos os e-mails de funcionários de RH e dados pessoais, e então transmitir essas informações aos invasores.A vítima do ataque não notou nada de anormal.

É bastante difícil fazer com que um agente de IA se torne desonesto e vaze dados. Os pesquisadores levaram muito tempo para alcançar o resultado desejado. Neste caso, o vazamento de dados ocorreu na infraestrutura de nuvem da OpenAI, tornando-o indetectável pelas ferramentas padrão de segurança cibernética. Os pesquisadores acrescentaram que outros serviços conectados ao Deep Research, como Outlook, GitHub, Google Drive e Dropbox, podem ser vulneráveis ​​a ataques semelhantes.

admin

Postagens recentes

Cientistas produziram hidrogênio a partir da água sem o uso de metais preciosos em catalisadores.

Nas décadas de 1970 e 1980, circulou uma teoria da conspiração de que as corporações…

21 minutos atrás

Executivos da Intel acreditam que a tecnologia de processo 14A permitirá que a empresa concorra com a TSMC.

A gestão anterior da Intel também depositou grandes esperanças no processo 18A, mas o atual…

45 minutos atrás

O CEO da Nvidia expressou confiança de que as importações de aceleradores americanos para a China serão permitidas.

Jensen Huang, CEO e fundador da Nvidia, juntou-se à delegação do governo do presidente dos…

1 hora atrás

A conferência de desenvolvedores da Apple, WWDC, terá início em 8 de junho, com foco em inteligência artificial.

A Apple realizará sua Conferência Mundial de Desenvolvedores (WWDC, na sigla em inglês) anual de…

2 horas atrás

O primeiro voo da Starship V3, parte do programa Flight 12, foi adiado para 20 de maio.

A SpaceX remarcou o primeiro lançamento de teste da versão mais recente do foguete Starship…

2 horas atrás

O Google lançou uma grande atualização para os ícones de seus serviços, tornando-os mais personalizados.

O Google lançou uma grande atualização no design dos ícones de seus principais serviços, abandonando…

2 horas atrás