A Anthropic publicou o primeiro relatório sobre seu projeto de cibersegurança, o Projeto Glasswing, lançado em abril. A iniciativa é baseada no modelo de IA Claude Mythos Preview, ainda não amplamente disponível, que ajudou os parceiros da Anthropic a descobrirem mais de 10.000 vulnerabilidades em seus softwares em apenas um mês.

Fonte da imagem: Anthropic
A maioria das empresas que tiveram acesso à rede neural identificou centenas de bugs críticos em seus produtos. De acordo com o Engadget, a Cloudflare descobriu 2.000 vulnerabilidades, das quais 400 foram classificadas como de alta ou crítica gravidade. A Mozilla encontrou e corrigiu 271 bugs no navegador Firefox, superando significativamente os resultados dos testes com versões anteriores do modelo Claude. O recente anúncio da Microsoft sobre um aumento nas atualizações de segurança também está diretamente relacionado aos resultados da varredura de infraestrutura usando o Mythos Preview.
Além do setor corporativo, os especialistas da Anthropic testaram mil projetos de código aberto, onde a IA identificou mais de 6.200 ameaças críticas em um total de 23.000 falhas detectadas. Além disso, pesquisadores independentes afirmaram que, usando o Mythos, conseguiram encontrar uma maneira de invadir o sistema operacional macOS. Apesar da alta eficiência, a Anthropic está, por enquanto, adiando o lançamento público do modelo, pois os desenvolvedores temem que a tecnologia seja explorada por atacantes e planejam disponibilizar o algoritmo publicamente somente após o desenvolvimento de mecanismos de segurança robustos.
A Anthropic está expandindo a disponibilidade do Projeto Glasswing, trabalhando para restabelecer as relações com o governo dos EUA e buscando colaborações de grandes empresas de tecnologia, incluindo Apple, Google e Nvidia.