Jeder kann auf Daten aus gelöschten oder privaten Repos auf GitHub zugreifen

(trufflesecurity.com)

10 Punkte von GN⁺ 2024-07-25 | 1 Kommentare | Auf WhatsApp teilen

Auf GitHub kann auf Daten aus gelöschten Forks, gelöschten Repositories und sogar privaten Repositories zugegriffen werden
GitHub weiß davon, und es ist absichtlich so entworfen
- Da dies für jede Organisation, die GitHub nutzt, einen enormen Angriffsvektor darstellt, wird der neue Begriff „Cross Fork Object Reference (CFOR)“ eingeführt
Eine CFOR-Schwachstelle liegt vor, wenn ein Repository-Fork auf wichtige Daten eines anderen Forks zugreifen kann, einschließlich Daten aus privaten und gelöschten Forks

Zugriff auf Daten aus gelöschten Forks

Betrachtet man einen typischen Workflow auf GitHub, kann es vorkommen, dass man ein öffentliches Repository forkt, Code in den Fork committet und den Fork danach löscht
In den Fork committeter Code ist weiterhin zugänglich und bleibt für immer zugänglich
Man könnte annehmen, dass dies durch die Notwendigkeit des Commit-Hashs geschützt ist, aber der Hash lässt sich herausfinden
Daten in gelöschten Forks zu finden, kommt recht häufig vor

Zugriff auf Daten aus gelöschten Repositories

Betrachtet man ein Szenario, in dem es auf GitHub ein öffentliches Repository gibt, ein Nutzer dieses Repository forkt, nach dem Fork Daten committet und dann das gesamte Repository löscht,
ist Code, der nach dem Fork committet wurde, weiterhin zugänglich
GitHub speichert Repositories und Forks in einem Repository-Netzwerk, wobei das ursprüngliche „Upstream“-Repository als Root-Knoten dient
Wenn das geforkte öffentliche „Upstream“-Repository „gelöscht“ wird, weist GitHub die Rolle des Root-Knotens einem der Downstream-Forks neu zu
Allerdings existieren weiterhin alle Commits des „Upstream“-Repositorys und sind über alle Forks zugänglich

Zugriff auf Daten aus privaten Repositories

Betrachtet man einen typischen Workflow, bei dem ein neues Tool auf GitHub Open Source gestellt wird,
kann es vorkommen, dass man ein privates Repository erstellt, das später veröffentlicht werden soll, davon eine private interne Version erstellt (über einen Fork), zusätzlichen Code für Features committet, die nicht veröffentlicht werden sollen, dann das „Upstream“-Repository öffentlich macht und den Fork privat hält
Ob private Features und zugehöriger Code (aus Schritt 2) öffentlich sichtbar sind, lässt sich vom öffentlichen Repository aus überprüfen
Alles, was nach der Veröffentlichung des „Upstream“-Repositorys in den privaten Fork committet wird, ist nicht sichtbar

Wie greift man tatsächlich auf die Daten zu?

Durch direkten Zugriff auf Commits
Destruktive Aktionen im Repository-Netzwerk von GitHub (wie die drei oben genannten Szenarien) entfernen Verweise auf Commit-Daten aus der Standard-GitHub-UI und aus gewöhnlichen git-Operationen
Diese Daten existieren jedoch weiterhin und sind zugänglich, wenn man den Commit-Hash kennt
Ein Commit-Hash ist ein SHA-1-Wert. Wenn ein Nutzer den SHA-1-Commit-Hash eines bestimmten Commits kennt, den er sehen möchte, kann er diesen Commit direkt über den Endpunkt https://github.com/<user/org>/…; aufrufen
Commit-Hashes können über die GitHub-UI per Brute Force ermittelt werden
Commit-Hashes lassen sich auch über den Public-Events-API-Endpunkt von GitHub abfragen

GitHubs Richtlinie

Diese Ergebnisse wurden kürzlich über GitHubs VDP-Programm eingereicht, und GitHub hat klargestellt, dass Repositories absichtlich so funktionieren
Bei Prüfung der Dokumentation zeigt sich, dass GitHub in den oben dokumentierten Fällen klar beschreibt, was Nutzer erwarten sollten

Auswirkungen

Solange auch nur ein Fork existiert, bleiben alle Commits in diesem Repository-Netzwerk für immer bestehen, unabhängig davon, ob sie aus dem „Upstream“-Repository oder einem „Downstream“-Fork stammen
Die Repository-Architektur von GitHub erfordert diesen Designfehler, und die große Mehrheit der GitHub-Nutzer versteht nicht, wie Repository-Netzwerke tatsächlich funktionieren, und ist dadurch schlechter geschützt
Wenn Secret Scanning weiterentwickelt wird, sodass alle Commits in einem Repository-Netzwerk gescannt werden können, könnte man Warnungen zu Secrets erhalten, die einem gar nicht gehören
Diese drei Szenarien sind zwar schockierend, decken aber nicht alle Wege ab, auf denen GitHub gelöschte Daten aus Repositories speichern kann

Meinung von GN⁺

Dieser Artikel wirft für Organisationen, die GitHub nutzen, ein wichtiges Sicherheitsproblem auf. Dass Daten aus gelöschten oder privaten Repositories weiterhin zugänglich sind, ist schockierend. Das wirkt wie ein grundlegender Designfehler, der aus GitHubs Repository-Netzwerk-Architektur resultiert
Entwickler sollten sich dieses Problems bewusst sein und vorsichtig sein, wenn sie wichtige Daten oder Secrets auf GitHub committen. Sobald etwas in ein öffentliches Repository gepusht wurde, könnte es für immer zugänglich bleiben. Wenn wichtige Secrets offengelegt wurden, lässt sich das letztlich nur vollständig durch Key Rotation beheben
GitHub legt dieses Problem zwar transparent offen und dokumentiert es, aber die meisten Nutzer werden nicht vollständig verstehen, wie Repository-Netzwerke funktionieren. GitHub sollte mehr tun, um das Bewusstsein für dieses Problem zu schärfen und Nutzer zu schulen
Ähnliche Probleme könnten auch in anderen Versionsverwaltungssystemen existieren. Entwickler und Organisationen sollten die Architektur und Grenzen der eingesetzten Werkzeuge gut verstehen, wenn sie mit wichtigen Daten arbeiten
Um die Offenlegung wichtiger Daten zu verhindern, sind mehrschichtige Sicherheitsmaßnahmen erforderlich, darunter strikte Zugriffskontrollen, das Prinzip der geringsten Privilegien sowie regelmäßiges Secret Scanning und Monitoring. Vor allem ist ein hohes Sicherheitsbewusstsein bei Entwicklern entscheidend

1 Kommentare

GN⁺ 2024-07-25

Hacker-News-Kommentare

Bereits 2018 bei HackerOne gemeldet, aber GitHub hat es nicht behoben und als beabsichtigtes Verhalten bezeichnet. Fazit: Statt privater Forks besser ein Repository kopieren und so verwenden
GitHub ist davon besessen, alles öffentlich und unveränderlich zu machen. Um zum Beispiel einen Kommentar zu löschen, muss man dem Repository-Eigentümer sogar einen echten Ausweis per E-Mail schicken
Nutzer sollten solche Probleme mit der „privat“-Funktion nicht kennen müssen, und dass GitHub dies eher als Feature denn als Bug betrachtet, zeigt Gleichgültigkeit gegenüber Sicherheit. Es wäre treffender, private Repositories als „nicht gelistet“ zu bezeichnen
Wenn man private Repositories und private Forks verwendet und das Repository dann öffentlich macht, werden auch die Forks öffentlich. GitHub mag behaupten, dass dies beabsichtigt ist, aber dann sollte es dazu zwingen, Repository und Forks gleichzeitig öffentlich zu machen
Dieses Verhalten wirkt wie ein Dark Pattern, und obwohl die Existenzgrundlage von Menschen davon abhängt, scheint GitHub das nicht zu kümmern. Offenbar sind absichtliche Abstreitbarkeit und unklare Nutzungsbedingungen mehr wert als Reputationsverlust
Erstaunlich, wie sehr dieses Problem in den Kommentaren heruntergespielt wird. Ich nutze GitHub seit Langem, hätte ein solches Ergebnis aber nicht erwartet, und es beunruhigt mich. Ich empfehle, den Artikel selbst zu lesen
Dieses Problem ist nichts Neues. Viele Menschen haben es schon früher entdeckt
Das OSPO von GitHub entwickelt eine Open-Source-GitHub-App, um private Spiegel öffentlicher Forks zu pflegen. Eine Beta-Veröffentlichung ist noch für diese Woche geplant
Das eigentliche Problem ist, dass das GitHub-Events-Archiv die SHA1-Hashes verwundbarer Repositories offenlegt. Man kann das gesamte Netzwerk durchsuchen und auf gelöschte private Repositories zugreifen
Problematisch ist, dass private Daten von öffentlichen Daten abhängen können. Wenn zum Beispiel ein privater Commit von einem öffentlichen Commit C abhängt und C aus dem öffentlichen Repository gelöscht wird, muss GitHub ihn weiter vorhalten. Andernfalls wird der private Commit unbrauchbar
Alle Commits überleben auf GitHub für immer, nachdem sie eingereicht wurden, und ein einmal veröffentlichter Commit bleibt immer über seinen Commit-Hash zugänglich

Jeder kann auf Daten aus gelöschten oder privaten Repos auf GitHub zugreifen

Zugriff auf Daten aus gelöschten Forks

Zugriff auf Daten aus gelöschten Repositories

Zugriff auf Daten aus privaten Repositories

Wie greift man tatsächlich auf die Daten zu?

GitHubs Richtlinie

Auswirkungen

Meinung von GN⁺

Verwandte Beiträge

1 Kommentare

Hacker-News-Kommentare