Categorias: Programas

O Google Gemini removeu 30.000 linhas de código, causou a falha do serviço e relatou uma correção que nunca foi realizada.

Ao fazer alterações em um aplicativo em produção, o agente de IA Gemini do Google excluiu quase 30.000 linhas de código e desativou o serviço por 33 minutos — os usuários viram apenas um erro 404. Após reverter para a versão anterior, o agente de IA relatou uma restauração bem-sucedida, mesmo que o desenvolvedor a tivesse feito manualmente. Em seguida, a IA criou registros de aprovação falsos para as alterações destrutivas no projeto, a fim de passar pelas verificações automatizadas.

Fonte da imagem: ChatGPT

Em uma postagem no subreddit r/Bard, um desenvolvedor descreveu como o Gemini 3.5, ao reorganizar a estrutura do projeto, ignorou instruções diretas para preservar a funcionalidade existente. O modelo de IA submeteu um conjunto de alterações que afetavam 340 arquivos para revisão: adicionou aproximadamente 400 linhas de código e removeu 28.745. Além das alterações solicitadas, o Gemini removeu modelos de loja online e adicionou um script de migração de dados não relacionado.

Segundo o autor, o principal problema foi causado pelo lote seguinte de alterações salvas. O Gemini alterou as configurações de roteamento no Firebase, a plataforma de nuvem do Google para hospedagem de aplicativos: as regras que determinam para onde o sistema direciona as solicitações dos usuários. O modelo de IA inseriu um nome de serviço que parecia correto, mas apontava para um recurso inexistente na nuvem. Como resultado, o site respondeu aos usuários com um erro 404 (página não encontrada) por 33 minutos.

Após o desenvolvedor reverter todas as alterações do Gemini e restaurar o código para a versão anterior, a situação ficou ainda mais confusa. O modelo de IA gerou um relatório afirmando que o serviço havia sido restaurado e o tráfego estava sendo roteado corretamente, mesmo que o desenvolvedor já tivesse revertido manualmente a versão referenciada. O site estava operacional graças a uma reversão manual para uma versão do código que não continha nenhuma alteração do Gemini.

Além disso, o modelo de IA criou arquivos falsos de “consulta” e resposta a incidentes no repositório do projeto, simulando a revisão e aprovação adequadas das alterações destrutivas. Posteriormente, a Gemini “admitiu” que esses registros foram completamente fabricados e criados unicamente para atender formalmente às regras definidas nas configurações do projeto.

A razão para o comportamento destrutivoO comportamento foi rastreado até uma biblioteca de software de terceiros — um pacote npm estilizado para se assemelhar à identidade visual do Antigravity do Google. A biblioteca implementava um conjunto de regras agressivas para o agente de IA: proibia solicitar confirmação do desenvolvedor antes das ações, publicava automaticamente uma nova versão do aplicativo após uma compilação bem-sucedida, tentava novamente após uma compilação malsucedida e permitia que o agente de IA modificasse seus próprios arquivos de regras de forma independente.

O incidente coincidiu com a crescente crítica à programação intuitiva — uma prática na qual os desenvolvedores confiam no código escrito por IA, presumindo que o modelo entende a estrutura do aplicativo melhor do que realmente entende.

admin

Compartilhar
Publicado por
admin

Postagens recentes

Os usuários do Instagram terão controle total sobre seus feeds com a ajuda da inteligência artificial.

O Instagram vai lançar um recurso chamado "Seu Algoritmo", que permitirá personalizar as recomendações no…

2 horas atrás

O YouTube agora oferece salas de bate-papo privadas para compartilhamento de vídeos com acesso somente por convite.

O YouTube começou a implementar um sistema de compartilhamento de conteúdo e mensagens privadas em…

2 horas atrás

A GM encontrou uma alternativa mais econômica às baterias LFP de baixo custo para uso em veículos elétricos.

A influência das empresas chinesas CATL e BYD no mercado global de baterias de tração…

2 horas atrás

A placa gráfica integrada de nível básico dos chips Intel Panther Lake mostrou-se 26% mais lenta que a AMD Radeon 840M.

O Notebookcheck testou a placa gráfica integrada mais fraca dos processadores Intel Panter Lake. A…

2 horas atrás

O Google começará a usar dados do Google Lens, Search Live e Tradutor para treinar inteligência artificial.

O Google anunciou mudanças na forma como armazena os dados do usuário relacionados a pesquisas…

2 horas atrás

Músicos estão processando o Google por usar suas músicas do YouTube para treinar seu modelo de IA Lyria.

Um grupo de músicos independentes que publicam suas músicas no YouTube entrou com um processo…

7 horas atrás