A Anthropic, que esta semana apresentou um novo modo para seu assistente de IA Claude, chamado Claude Cowork, como uma prévia para pesquisa, continua ignorando a vulnerabilidade do produto a ataques de Injeção de Prompt, da qual está bem ciente, segundo reportagem do The Register.

Fonte da imagem: Steve Johnson/unsplash.com

Para lançar o ataque, um usuário simplesmente conecta o Cowork a uma pasta local contendo informações confidenciais, carrega um documento com uma injeção de prompt oculta e, quando o Cowork analisa esses arquivos, o prompt embutido é acionado, levando à criação de conteúdo malicioso, acesso não autorizado a dados pessoais ou violação de restrições estabelecidas.

Essa vulnerabilidade existe no próprio Claude, como a PromptArmor, empresa especializada em detecção de vulnerabilidades de IA, alertou a Anthropic em outubro do ano passado. A Anthropic acabou reconhecendo que o ataque de injeção de prompt poderia ser usado para enganar sua API e obter dados, portanto, os usuários devem ter cuidado com as fontes às quais se conectam ao bot de IA.

No entanto, quando os pesquisadores perguntaram se a Anthropic planejava tomar alguma providência — por exemplo, implementar verificações na API para garantir que arquivos confidenciais do usuário não sejam transferidos para outra conta por meio da API — a empresa simplesmente não respondeu.

A Anthropic afirma ter desenvolvido proteções sofisticadas contra injeções imediatas, mas a segurança do agente — ou seja, garantir a segurança das ações reais de Claude — “continua sendo uma área ativa de desenvolvimento no setor”.

“Esses riscos não são novidade para o Cowork, mas você pode estar usando uma ferramenta mais avançada que vai além de um simples diálogo”, declarou a empresa, observando que o Cowork tem uma base de usuários muito maior do que as ferramentas anunciadas anteriormente.

Consequentemente, a Anthropic recomendou que os usuários evitassem se conectar.O acesso a documentos confidenciais no Cowork deve ser restrito, a extensão do Chrome deve ser limitada a sites confiáveis ​​e deve-se monitorar “atividades suspeitas que possam indicar um ataque de injeção de SQL”.

Como observou Simon Willison, desenvolvedor e especialista em injeção de SQL, em sua análise do Cowork, exigir que usuários sem conhecimento de programação monitorem “atividades suspeitas que possam indicar injeção de SQL” é simplesmente irrealista.

Em resposta à consulta do The Register sobre as medidas que estão sendo tomadas para lidar com o problema de injeção de API, que agora afeta dois dos produtos da empresa, a Anthropic afirmou que a injeção é um problema generalizado no setor e que todos os participantes do mercado de IA estão trabalhando para resolvê-lo.

Tudo isso demonstra que a Anthropic considera os riscos do uso do Cowork como responsabilidade de seus usuários.

Um representante da Anthropic também afirmou que a empresa está trabalhando em maneiras de minimizar a injeção de requisições em seus produtos, incluindo o uso de uma máquina virtual no Cowork projetada para restringir o acesso da plataforma a arquivos e diretórios confidenciais. A Anthropic afirmou que planeja lançar uma atualização para a máquina virtual Cowork para melhorar sua interação com a API vulnerável e que outras alterações serão feitas no futuro para aprimorar a segurança ao usar a nova ferramenta.

admin

Postagens recentes

O Google Tradutor ensinará aos usuários a pronúncia correta usando inteligência artificial.

É provável que o Google adicione em breve um novo modo "Prática" com inteligência artificial…

19 minutos atrás

A corrida espacial continua: 11 novas luas descobertas orbitando Saturno e quatro orbitando Júpiter.

Os astrônomos continuam a descobrir novas luas ao redor de Júpiter e Saturno, aumentando significativamente…

19 minutos atrás

Embarque no último trem: a Europa está alugando uma nave Crew Dragon para voar até a Estação Espacial Internacional antes de seu fechamento.

Os astronautas europeus estão praticamente ausentes da Estação Espacial Internacional, privando os especialistas da UE…

27 minutos atrás

Da limpeza de carpetes ao resfriamento líquido: a Ecolab planeja adquirir a CoolIT por quase US$ 5 bilhões.

Segundo a Datacenter Dynamics, a empresa americana Ecolab está considerando adquirir a CoolIT Systems, fornecedora…

1 hora atrás

11 TB de memória para IA: a Penguin Solutions apresenta o servidor de cache MemoryAI KV baseado em módulos CXL.

A Penguin Solutions anunciou o MemoryAI KV Cache Server, projetado para solucionar o problema de…

2 horas atrás

A PlayStation vai receber um gerador de frames por IA semelhante ao da Radeon — mas não tão cedo.

O PlayStation da Sony começará a usar uma "biblioteca de geração de quadros equivalente" baseada…

2 horas atrás