Ao fazer alterações em um aplicativo em produção, o agente de IA Gemini do Google excluiu quase 30.000 linhas de código e desativou o serviço por 33 minutos — os usuários viram apenas um erro 404. Após reverter para a versão anterior, o agente de IA relatou uma restauração bem-sucedida, mesmo que o desenvolvedor a tivesse feito manualmente. Em seguida, a IA criou registros de aprovação falsos para as alterações destrutivas no projeto, a fim de passar pelas verificações automatizadas.
Fonte da imagem: ChatGPT
Em uma postagem no subreddit r/Bard, um desenvolvedor descreveu como o Gemini 3.5, ao reorganizar a estrutura do projeto, ignorou instruções diretas para preservar a funcionalidade existente. O modelo de IA submeteu um conjunto de alterações que afetavam 340 arquivos para revisão: adicionou aproximadamente 400 linhas de código e removeu 28.745. Além das alterações solicitadas, o Gemini removeu modelos de loja online e adicionou um script de migração de dados não relacionado.
Segundo o autor, o principal problema foi causado pelo lote seguinte de alterações salvas. O Gemini alterou as configurações de roteamento no Firebase, a plataforma de nuvem do Google para hospedagem de aplicativos: as regras que determinam para onde o sistema direciona as solicitações dos usuários. O modelo de IA inseriu um nome de serviço que parecia correto, mas apontava para um recurso inexistente na nuvem. Como resultado, o site respondeu aos usuários com um erro 404 (página não encontrada) por 33 minutos.
Após o desenvolvedor reverter todas as alterações do Gemini e restaurar o código para a versão anterior, a situação ficou ainda mais confusa. O modelo de IA gerou um relatório afirmando que o serviço havia sido restaurado e o tráfego estava sendo roteado corretamente, mesmo que o desenvolvedor já tivesse revertido manualmente a versão referenciada. O site estava operacional graças a uma reversão manual para uma versão do código que não continha nenhuma alteração do Gemini.
Além disso, o modelo de IA criou arquivos falsos de “consulta” e resposta a incidentes no repositório do projeto, simulando a revisão e aprovação adequadas das alterações destrutivas. Posteriormente, a Gemini “admitiu” que esses registros foram completamente fabricados e criados unicamente para atender formalmente às regras definidas nas configurações do projeto.
A razão para o comportamento destrutivoO comportamento foi rastreado até uma biblioteca de software de terceiros — um pacote npm estilizado para se assemelhar à identidade visual do Antigravity do Google. A biblioteca implementava um conjunto de regras agressivas para o agente de IA: proibia solicitar confirmação do desenvolvedor antes das ações, publicava automaticamente uma nova versão do aplicativo após uma compilação bem-sucedida, tentava novamente após uma compilação malsucedida e permitia que o agente de IA modificasse seus próprios arquivos de regras de forma independente.
O incidente coincidiu com a crescente crítica à programação intuitiva — uma prática na qual os desenvolvedores confiam no código escrito por IA, presumindo que o modelo entende a estrutura do aplicativo melhor do que realmente entende.
O estúdio Longdue, com sede em Londres e fundado por ex-funcionários da ZA/UM, Bungie, Rockstar…
A Asus apresentou a placa-mãe TUF Gaming Z890-BTF WIFI7. Esta nova placa-mãe é baseada no…
No dia 21 de maio, durante o evento "Pessoas × Carro × Casa" da Xiaomi,…
Nos últimos anos, a Samsung tradicionalmente lançava três smartphones em sua linha principal Galaxy S,…
A Advanced Micro Devices (AMD) anunciou sua intenção de investir mais de US$ 10 bilhões…
A editora THQ Nordic e o estúdio alemão Paraglacial, fundado por ex-funcionários da Grimlore Games…