O Google DeepMind, divisão especializada no estudo e desenvolvimento de sistemas de inteligência artificial, anunciou um investimento de US$ 10 milhões para estudar cenários em que milhões de agentes de IA interagem entre si. Diversas organizações públicas e privadas de todo o mundo concordaram em participar do projeto.

Fonte da imagem: deepmind.google
Em poucos meses, agentes de IA serão implantados globalmente em uma escala tão grande que os riscos associados se tornarão uma preocupação real, e os cientistas querem se antecipar a isso. As ameaças potenciais se resumem a versões amplificadas dos piores cenários já observados hoje: esquemas fraudulentos, injeções de consultas que transformam agentes de IA em malware teleguiado e outras formas de ataques cibernéticos. A única maneira de entender o que pode acontecer quando um grande número de sistemas multiagentes interage entre si é realizar simulações realistas: colocar agentes de IA em ambientes isolados e observar seu comportamento.
É impossível prever o que acontecerá se você estudar agentes individuais, ou mesmo vários agentes, isoladamente. E você não pode presumir que agentes de IA seguindo instruções de grandes modelos de linguagem agirão racionalmente — a complexidade surge diante de interações simultâneas massivas. Existe uma teoria, não descartada nem mesmo pelo Google DeepMind, de que a inteligência artificial forte (IAF) não surgirá de um único modelo superinteligente, mas sim será o produto de uma espécie de inteligência coletiva de agentes de IA, onde as capacidades de um grupo se mostram maiores do que a soma de suas partes.
O Google DeepMind não é o único grande desenvolvedor a alertar sobre as ameaças representadas pelas tecnologias que cria. A Anthropic já publicou recomendações para a implantação de agentes de IA com base no princípio da “confiança zero”: deve-se presumir que o sistema computacional é vulnerável, o agente é malicioso e um ataque cibernético é inevitável. Anteriormente, abordagens para garantir a segurança do sistema foram discutidas.Especialistas afirmam que os projetos de cibersegurança partiam do pressuposto de que a ameaça se originava de softwares escritos por humanos, executando ações fixas em trajetórias predefinidas. Um agente de IA opera de forma diferente: ele raciocina, improvisa e pode ser hackeado com apenas uma frase em um documento que lhe é solicitado que leia. É importante que o projeto considere não apenas cenários hipotéticos exóticos, mas também problemas corriqueiros que já existem.