2 Punkte von GN⁺ 2025-06-12 | 1 Kommentare | Auf WhatsApp teilen
  • Auf GitHub wurde das milliardste Repository erstellt
  • Dies ist ein Meilenstein, der das explosive Wachstum des Open-Source-Ökosystems zeigt
  • Unzählige Entwickler und Projekte nutzen GitHub als Kernplattform für Zusammenarbeit und Innovation
  • Es lohnt sich, sowohl das bisherige Wachstumstempo als auch die künftigen Möglichkeiten der technologischen Entwicklung zu beachten
  • Dies ist ein wichtiges Ereignis, das die Expansion und Vielfalt der globalen Tech-Community widerspiegelt

Überblick

  • Kürzlich wurde auf der Plattform GitHub das milliardste Repository erstellt
  • Dies symbolisiert das kontinuierliche Wachstum der Entwickler-Community und die Verbreitung der Open-Source-Kultur seit dem Start im Jahr 2008
  • GitHub hat sich als zentrales Werkzeug für die Softwareentwicklung etabliert, etwa für Quellcodeverwaltung, Zusammenarbeit und Versionsverwaltung
  • Mit der Erstellung von 1 Milliarde Projekten und Repositorys wurde weltweit der Raum für innovative Ideen und Zusammenarbeit erweitert
  • Dieser Meilenstein ist ein weiterer Anlass, die Stärke von Open-Source-Software und den Einfluss des globalen Entwicklernetzwerks zu verdeutlichen

1 Kommentare

 
GN⁺ 2025-06-12
Hacker-News-Kommentare
  • Ein Erfahrungsbericht, der an den 100.000.000. OpenStreetMap-Changeset erinnert: Ich und einige andere hatten es auf diesen Rekord abgesehen, am Ende bekam ihn aber jemand, der sich ohne jeden Gedanken daran ganz auf das Mapping in Afrika konzentrierte. Mit etwas Abstand fühlt sich das wie das schönere Ende an. Die Person war auch früher schon für einen OSM-Preis nominiert. Da bei OpenStreetMap alle Änderungen sofort in die Live-Produktionsumgebung übernommen werden, ist es strukturell schwer, bedeutungslose Beiträge zu leisten; deshalb landet so eine Meilenstein-Nummer oft eher zufällig bei jemandem. Ich finde solche Meilensteine bei GitHub ebenfalls eine nette Leistung. Wer sich für OSM-Meilensteine interessiert, dem seien der offizielle Blog und mein zusammengefasster Beitrag empfohlen.
  • Es wird darüber gesprochen, dass die numerischen GitHub-Repository-IDs irgendwann so groß werden könnten, dass sie einen Overflow auslösen; wenn künftig noch eine weitere Milliarde erzeugt wird, könnte auch die GitHub-OpenAPI-Spec die int32-Grenze überschreiten. Siehe: zugehöriges Issue
    • In einem Unternehmen, in dem jemand früher als CTO gearbeitet hat, wurden in wichtigen Tabellen 32-Bit-Integer als Primary Key verwendet, und dort hatten sich bereits 1,3 Milliarden Einträge angesammelt. Es hätte also in wenigen Monaten ein Overflow-Problem geben können. Man erweiterte hastig auf 64 Bit und verhinderte so einen größeren Zwischenfall.
  • Aus Spaß wurde der Anfang der GitHub-Repository-IDs geteilt: Das erste Repository kann man direkt über die API ansehen, und die Repository-Adresse ist hier.
  • Erstaunen darüber, wie einfach sich die Geschwindigkeit der Repository-Erstellung bei GitHub berechnen lässt; solche Informationen gelten normalerweise eher als Firmengeheimnis.
    • Ein heiterer Vergleich dazu, dass ein Dienst wie GitHub, wenn er einmal enorm groß geworden ist, mit solchen Informationen tendenziell lockerer umgeht.
    • Die Frage, ob GitHub überhaupt einen Grund hätte, solche Informationen zu verbergen, und ob man diese Daten überhaupt zum Nachteil von GitHub nutzen könnte; dazu der Hintergrund, dass viele Unternehmen grundsätzlich dazu neigen, möglichst wenig Informationen offenzulegen.
  • Insgesamt die Neugier, wie viele Repositories auf den einzelnen Servern tatsächlich existieren, einschließlich Forgejo und GitLab, je nach Fall auch unter Einbeziehung von Subversion, Mercurial und git. Es wird gefragt, ob jemals eine Suchmaschine für solche verteilten Repositories gebaut wurde und ob sich die Gesamtgröße womöglich schon durch eine Suche nach einem simplen Wort wie a abschätzen ließe. Bei zentralisierten Plattformen wie GitHub wurde es als Vorteil empfunden, Open-Source-Code leicht finden zu können. Nach der Übernahme von GitHub durch Microsoft gab es sogar Überlegungen, selbst eine Suchmaschine zu bauen, die aber wegen schwieriger Vermarktung aufgegeben wurden. Durch das jüngste Hochladen mehrerer Projekte auf Codeberg ist das Interesse wieder aufgekommen, verbunden mit dem Gedanken, dass vielleicht schon jemand so etwas gebaut hat.
  • Die Frage, ob AasishPokhrel das Milliardste-Repository gezielt erstellt hat, um genau diesen Rekord zu bekommen.
    • Die Erklärung, dass es tatsächlich nicht schwer sei, auf so etwas zu zielen: Wenn man fortlaufend Repositories erstellt, kann man irgendwann die entsprechende Nummer erwischen. Da gleichzeitig auch andere Leute Repositories anlegen, bleibt es am Ende Glückssache. Dank API-Unterstützung ist der Versuch selbst einfach, nur Rate Limits sind ein Faktor.
    • Es gibt Aufzeichnungen darüber, dass AasishPokhrel gestern zwei Repositories mit den Namen shit und yep erstellt hat. Vom 17. Mai bis zum 10. Juni gab es keine Aktivität, dann wurden neue Repositories angelegt. Es wird weitergegeben, dass man sich nicht sicher sei, ob es wirklich möglich ist, das Timing so exakt auf eine bestimmte Nummer auszurichten.
    • Soweit bekannt ist AasishPokhrel ein Informatikstudent in Nepal, der Softwareentwicklung studiert. Bewegend sei, dass ein solcher globaler Meilenstein bis auf die andere Seite der Erde reicht. Es wird ihm gewünscht, dass dieser Eintrag in seinem Lebenslauf einen großen Platz bekommt und zu einer guten Entwicklerkarriere führt.
    • Die Meinung, dass es wohl eher unwahrscheinlich ist, dass er gezielt darauf hingearbeitet hat, auch wenn man es nicht für unmöglich halten kann.
  • Vermutlich wurde per Skript fortlaufend eine Adresse wie https://api.github.com/repositories/999999999 geprüft, und sobald diese Nummer existierte, wurde sofort ein Repository erstellt. Möglich wäre auch, mehrere Repositories anzulegen, nur das mit der gewünschten Nummer zu behalten und den Rest wieder zu löschen. Wenn man sich die anderen gestern angelegten Repositories ansieht, wirkt es so, als habe man yep als Meilenstein-Nummer behalten wollen und shit als Namen gewählt, um ein Scheitern einzugestehen. Erwähnt wird außerdem eine frühere Praxis des Zahlentreffens wie im Facebook-D666666-Codemod-Fall.
  • Das milliardste Repository wird als Mitglied im „Drei-Kommas-Club“ bezeichnet.
    • Erwähnt wird der spanischsprachige Witz „Tres commas“ (drei Kommas).