Dados de milhares de repositórios GitHub agora privados ainda estão disponíveis no Copilot, descobrem pesquisadores

Dados que estavam disponíveis publicamente online, mesmo que momentaneamente, podem permanecer em posse de chatbots online de IA generativa, como o Microsoft Copilot, por muito tempo após o acesso a eles ter sido removido, de acordo com uma pesquisa da empresa israelense de segurança cibernética Lasso, especializada em ameaças emergentes de IA generativa.

Fonte da imagem: Windows/unsplash.com

O problema afeta milhares de repositórios GitHub que antes eram públicos, de diversas grandes empresas, incluindo a Microsoft, que já foram fechados, disse Lasso ao TechCrunch.

De acordo com o cofundador da Lasso, Ofir Dror, a empresa descobriu que o conteúdo de seu próprio repositório GitHub apareceu no Copilot porque foi indexado e armazenado em cache pelo mecanismo de busca Bing da Microsoft. Este repositório foi aberto por engano por um curto período de tempo e agora é privado. Ao tentar acessá-lo no GitHub, aparece a mensagem “Página não encontrada”.

«No Copilot, curiosamente, encontramos um de nossos próprios repositórios fechados, disse Dror. — Se eu estivesse navegando na web, não veria esses dados. Mas qualquer um pode obtê-los fazendo a pergunta certa ao Copilot.”

Em resposta, a Lasso conduziu uma investigação na qual extraiu uma lista de repositórios que estavam acessíveis publicamente em algum momento em 2024 e identificou aqueles que foram removidos ou tornados privados. Usando o mecanismo de cache do Bing, a empresa descobriu que mais de 20.000 repositórios privados do GitHub de mais de 16.000 organizações ainda estavam acessíveis pelo Copilot. Isso se aplica em particular à Amazon Web Services, Google, IBM, PayPal, Tencent e Microsoft.

Dror disse que Lasso contatou todas as empresas que foram “seriamente afetadas” pela violação de dados e as aconselhou a rotacionar ou revogar quaisquer chaves comprometidas.

A Lasso notificou a Microsoft sobre suas descobertas em novembro de 2024, mas a gigante do software disse que considerava o problema de “baixa gravidade”, dizendo que o comportamento de cache era “aceitável”. A Microsoft observou que não incluirá mais links de cache do Bing nos resultados de pesquisa a partir de dezembro de 2024.

No entanto, Lasso alega que, embora o recurso de cache estivesse desabilitado, o Copilot ainda tinha acesso aos dados, mesmo que eles não estivessem refletidos nos resultados de pesquisa na web.

avalanche

Postagens recentes

Uma “anomalia” fez com que um satélite Starlink se desintegrasse em órbita.

No último domingo, 29 de março de 2026, a SpaceX perdeu contato com o satélite…

50 minutos atrás

Alt Server e Alt Domain 11.1: escolha da edição na fase de instalação, melhoria do ambiente digital, gestão de serviços através de aplicações.

A Basalt SPO lançou uma atualização para o sistema operacional Alt Server com o pacote…

1 hora atrás

“Eu compraria imediatamente”: Fãs de Auto Modellista estão intrigados com o trailer do jogo de corrida arcade de mundo aberto Rogue Stradale.

Um desenvolvedor independente, sob o pseudônimo de Aerodynamic Monk, lançou Rogue Stradale, um jogo de…

1 hora atrás

Um novo trailer revelou a data de lançamento de Zero Parades: For Dead Spies, o RPG de espionagem inspirado em Disco Elysium.

O estúdio londrino ZA/UM anunciou a data de lançamento de seu RPG de espionagem Zero…

2 horas atrás

Um novo trailer revelou a data de lançamento de Zero Parades: For Dead Spies, o RPG de espionagem inspirado em Disco Elysium.

O estúdio londrino ZA/UM anunciou a data de lançamento de seu RPG de espionagem Zero…

2 horas atrás

As vendas de PCs nos EUA aumentaram 3% no final de 2025, mas cairão 13% este ano.

As remessas de PCs nos EUA no quarto trimestre de 2025 apresentaram um aumento de…

3 horas atrás