4 Punkte von GN⁺ 2026-02-23 | 1 Kommentare | Auf WhatsApp teilen
  • Ein Open-Source-Informationsarchiv, das die Daten des CIA World Factbook von 1990 bis 2025 strukturiert und für Suche und Analyse nutzbar macht
  • Enthält 281 Länder und Regionen, 36 Jahresausgaben und mehr als 1 Million Datenfelder
  • Bietet Länderprofile nach Jahr, Zeitreihendaten, Volltextsuche sowie Analysen zu Geografie-, Kommunikations- und Handelsnetzwerken
  • Enthält Analysetools wie ein Dashboard auf Basis von COCOM-Regionen, Indikatorenvergleiche zwischen Ländern und Visualisierungen globaler Trends
  • Basiert auf Public-Domain-Material und ist ein unabhängiges Projekt ohne Verbindung zur CIA oder zur US-Regierung

Überblick

  • Ein Datenarchiv, das 36 Jahre geopolitischer Informationen bewahrt und strukturiert
    • Basiert auf aus dem ursprünglichen CIA World Factbook geparsten Daten
    • Umfasst 281 Entitäten, 36 Ausgaben, 9.500 Länder-Jahr-Einträge und 1.061.341 Datenfelder
  • Alle Daten sind durchsuchbar, und Änderungen in Länderberichten lassen sich über die Jahre hinweg nachverfolgen

Plattformaufbau

  • Factbook Archive / Reference Library
    • Alle Ausgaben von 1990 bis 2025 können eingesehen werden
    • Zeigt die ursprünglichen Felddaten unverändert an und ermöglicht die Suche nach Veränderungen über die Jahre hinweg
  • Intelligence Analysis / Analytic Workspace
    • Ein nach DoD Combatant Commands (COCOM) gegliederter Analyse-Workspace
    • Bietet Choropleth-Karten, Zeitreihenvergleiche, länderspezifische Analysedossiers (im ICD-203-Format) und Vergleichsfunktionen zwischen Indikatoren

Hauptfunktionen

  • Library: Klassifiziert alle Entitäten nach Typ, einschließlich Flaggen
  • Country Profile: Einsicht in die vollständigen Felddaten jedes Landes
  • Full-Text Search: Schlüsselwortsuche in mehr als 1 Million Feldern mit Z39.58-Syntax
  • Field Time Series: Verfolgt die Entwicklung eines bestimmten Datenfelds über 36 Jahre
  • Factbook Quiz: Weltwissens-Quiz in 4 Modi
  • Factbook Export: Erstellt druckbare Länderberichte mit allen Feldern

Intelligence-Analysetools

  • Regional Dashboard: Weltkarte mit COCOM-Regionen und markierten Hauptstädten
  • Timeline Map: Visualisiert 36 Jahre Daten in animierter Form
  • Communications Analysis: Zeigt Kennzahlen zur Verbreitung von Internet, Mobilfunk und Breitband
  • Map Compare: Vergleicht synchronisierte Karten aus zwei Jahren
  • COCOM Region Detail: Zeigt zentrale Leistungsindikatoren (KPI) je Region
  • Intelligence Dossier: Länderspezifisches Analysedossier nach ICD-203-Standard
  • Global Rankings: Sortiert Länder nach Indikatoren
  • Global Trends: Weltweite Indikatortrends über alle Ausgaben hinweg
  • Compare Countries: Vergleicht Indikatoren zwischen Ländern
  • Field Explorer: Durchsucht alle Datenfelder und Abdeckungsstatistiken
  • Change Detection: Erkennt Feldänderungen nach Jahr
  • Dissolved States: Informationen zu Staaten und Regionen, die nicht mehr existieren
  • Trade Networks: Netzwerkgraphen zu Handelsbeziehungen
  • Organization Networks: Graphen zu Mitgliedschaften in internationalen Organisationen
  • Query Builder: Erstellt benutzerdefinierte Analyseabfragen
  • Text Diff: Vergleicht Texte zwischen Jahren und hebt Änderungen hervor

Projektinformationen

  • Alle Daten wurden aus Public-Domain-Material der US-Regierung (CIA World Factbook) gesammelt
  • Keine Verbindung zur CIA oder zur US-Regierung
  • Die Analyse folgt den ICD-203-Analysestandards
  • Quellcode und Methodik sind über das GitHub-Repository offengelegt

1 Kommentare

 
GN⁺ 2026-02-23
Hacker-News-Kommentare
  • Es wirkt, als hätte die aktuelle Regierung alle internen Daten des CIA World Factbook gelöscht, um künftige Wiederherstellungsversuche zu verhindern.
    Es wäre wirklich großartig, wenn die nächste Regierung diese archivierten Daten nutzen würde, um es wieder aufzubauen.
  • Genau so sollte Show HN funktionieren.
    Jemand stellt ein Projekt vor, die Community findet in Echtzeit Bugs, und der Ersteller behebt sie sofort.
    Das Problem mit kollidierenden FIPS- und ISO-Ländercodes ist ein gutes Beispiel dafür, dass man solche seltenen Bugs nur mit vielen Augen findet.
    Beeindruckend ist auch, dass der Ersteller nicht defensiv reagiert hat, sondern aktiv auf das Feedback eingegangen ist.
  • Für alle, die JSON- oder Markdown-Dateien des Factbook brauchen, gibt es dieses GitHub-Repository.
    Es wird als „Cache des Datensatzes der Länderprofile im Originalformat von CIA.gov (1:1)“ beschrieben.
    Detaillierte Daten gibt es unter cache.factbook.json.
    • Danke für den Link! Mein GitHub und meine Website verwenden diese Quelle ebenfalls.
      Ich fand nur, dass es nötig ist, die Daten von 1990 bis 2025 in eine SQL-Datenbank zu überführen, damit man sie abfragen kann.
  • An den Autor: Wenn du Felder oder Bugs in der Datenbank korrigierst, etwa bei Ländercodes, wäre es möglich, auch diese Version zu teilen?
    Dieser Datensatz eignet sich sehr gut für GraphRAG-Funktionstests.
    Man könnte damit wahrscheinlich auch ein Welt-Simulationsspiel auf Basis realer Daten bauen.
    • Natürlich! Alle Datenkorrekturen verwalte ich in einem .txt-Changelog.
      Der ursprünglich von der CIA veröffentlichte Inhalt bleibt unverändert, und ich bereinige beim Parsen nur Formatierungsrauschen.
      Zusätzlich habe ich eine Lookup-Tabelle erstellt, die FIPS-10-4-Codes, ISO Alpha-2/3 und MasterCountryID aufeinander abbildet, damit sie miteinander verknüpft werden können.
      Diese Materialien werde ich ebenfalls auf GitHub hinzufügen.
  • Tolles Projekt. Ich habe aber ein Problem gefunden.
    Wenn man im Factbook 2002 auf „Germany“ klickt, landet man jedes Mal auf der Seite von „Gambia“.
    Bei anderen Ländern habe ich dieses Verhalten nicht gesehen.
    • Ein weiteres Beispiel: Wenn man nach „Nicaragua“ sucht, wird man zur Seite von „Niger“ weitergeleitet.
  • Die Version 2025–2026 ist bereits extern kauf- und einsehbar, und die Ausgabe 2026–2027 soll am 7. April erscheinen.
    Amazon-Link
    • Ich wusste nicht, dass so ein Buch tatsächlich veröffentlicht wird. Danke für den Hinweis.
    • Das Internet Archive besitzt die Ausgabe 2025–2026; sie soll eingescannt und zu OpenLibrary hinzugefügt werden.
    • Wenn sie erscheint, werde ich sie auch meinem Projekt hinzufügen. Danke fürs Teilen der Information.
  • Dieser Link ist wirklich erstaunlich: Seite zur Analyse der Änderungen
  • Tolles Projekt. Aber es sieht so aus, als würde die Weltbevölkerung doppelt gezählt.
    Das lässt sich auf der Seite zur Trendanalyse sehen.
    • Ich habe die Ursache gefunden. Die Entität „World“ (etwa 8 Milliarden Menschen) wurde zusammen mit den einzelnen Ländern aufsummiert, wodurch die Gesamtsumme doppelt gezählt wurde.
      Danke für den Hinweis!
    • Ich behebe das gerade. Ich habe wohl schon zu lange draufgeschaut und so etwas übersehen. Danke, dass du es gemeldet hast.
  • Ist dieses Projekt ein Archiv, das einen Dienst bewahrt, der von der aktuellen US-Regierung im Weißen Haus eingestellt wurde?
    • Ja, genau dieser Dienst ist es.
  • Im Zeitreihendiagramm gibt es einen Bug. Bevor die Daten visualisiert werden, ist eine Normalisierung (normalization) nötig.
    Beispiel: Daten zu festen Breitbandanschlüssen in Indien
    • Ich habe das Problem gefunden. Der Regex zum Parsen von Gesamtsummen konnte Einheitensuffixe wie million oder billion nicht verarbeiten.
      So wurde zum Beispiel „18.17 million“ nur als 18.17 erkannt, was den Fehler mit dem starken Einbruch im Diagramm verursachte.
      Ich habe die Behandlung der Einheiten ergänzt, den Bug behoben und das Update gerade ausgerollt.
      Danke für den Hinweis.