Duizenden blootgestelde GitHub-repositories, nu privé, zijn nog steeds toegankelijk via Copilot

Beveiligingsonderzoekers waarschuwen dat gegevens die, al is het maar even, aan het internet zijn blootgesteld, lang kunnen blijven hangen in online generatieve AI-chatbots zoals Microsoft Copilot nadat de gegevens al privé zijn gemaakt.
Duizenden ooit openbare GitHub-opslagplaatsen van enkele van 's werelds grootste bedrijven zijn getroffen, waaronder die van Microsoft, zo blijkt uit nieuwe bevindingen van Lasso, een Israëlisch cybersecuritybedrijf dat zich richt op opkomende generatieve AI-bedreigingen.
Lasso medeoprichter Ophir Dror vertelde TechCrunch dat het bedrijf content uit zijn eigen GitHub-repository in Copilot zag verschijnen omdat het was geïndexeerd en gecached door Microsoft's Bing-zoekmachine. Dror zei dat de repository, die per ongeluk een korte periode openbaar was gemaakt, sindsdien op privé was gezet en dat toegang tot de repository op GitHub een foutmelding opleverde: "pagina niet gevonden".
"Op Copilot vonden we verrassend genoeg een van onze eigen privé-repositories," zei Dror. "Als ik op het web zou surfen, zou ik deze data niet zien. Maar iedereen ter wereld zou Copilot de juiste vraag kunnen stellen en deze data kunnen krijgen."
Toen Lasso zich realiseerde dat gegevens op GitHub, hoe kort ook, mogelijk openbaar konden worden gemaakt door tools als Copilot, ging het bedrijf verder op onderzoek uit.
Lasso haalde een lijst op van repositories die op enig moment in 2024 openbaar waren en identificeerde de repositories die inmiddels waren verwijderd of op privé waren gezet. Met behulp van het cachingmechanisme van Bing ontdekte het bedrijf dat meer dan 20.000 GitHub-repositories die sindsdien privé waren, nog steeds gegevens bevatten die toegankelijk waren via Copilot, wat gevolgen had voor meer dan 16.000 organisaties.
Volgens Lasso zijn de getroffen organisaties onder meer Amazon Web Services, Google, IBM, PayPal, Tencent en Microsoft zelf. Voor sommige getroffen bedrijven kan Copilot ertoe worden aangezet om vertrouwelijke GitHub-archieven terug te sturen die intellectueel eigendom, gevoelige bedrijfsgegevens, toegangssleutels en tokens bevatten, aldus het bedrijf.
Lasso merkte op dat het Copilot gebruikte om de inhoud van een GitHub-repository op te halen (die inmiddels door Microsoft is verwijderd) waarin een tool stond waarmee 'aanstootgevende en schadelijke' AI-afbeeldingen konden worden gemaakt met behulp van de cloud-AI-service van Microsoft.
Dror zei dat Lasso contact heeft opgenomen met alle getroffen bedrijven die “ernstig getroffen” zijn door de blootstelling van de gegevens en hen heeft geadviseerd om gecompromitteerde sleutels te roteren of in te trekken.
Geen van de door Lasso genoemde getroffen bedrijven reageerde op de vragen van TechCrunch. Microsoft reageerde ook niet op de vraag van TechCrunch.
Lasso informeerde Microsoft in november 2024 over zijn bevindingen. Microsoft vertelde Lasso dat het het probleem had geclassificeerd als "lage ernst" en dat dit cachegedrag "acceptabel" was. Microsoft nam vanaf december 2024 geen links meer op naar de cache van Bing in zijn zoekresultaten.
Volgens Lasso had Copilot nog steeds toegang tot de gegevens, ook al was de cachefunctie uitgeschakeld. Deze waren echter niet zichtbaar via traditionele zoekopdrachten op internet. Dit wijst erop dat er sprake is van een tijdelijke oplossing.
techcrunch