- Ein Open-Source-Informationsarchiv, das die Daten des CIA World Factbook von 1990 bis 2025 strukturiert und für Suche und Analyse nutzbar macht
- Enthält 281 Länder und Regionen, 36 Jahresausgaben und mehr als 1 Million Datenfelder
- Bietet Länderprofile nach Jahr, Zeitreihendaten, Volltextsuche sowie Analysen zu Geografie-, Kommunikations- und Handelsnetzwerken
- Enthält Analysetools wie ein Dashboard auf Basis von COCOM-Regionen, Indikatorenvergleiche zwischen Ländern und Visualisierungen globaler Trends
- Basiert auf Public-Domain-Material und ist ein unabhängiges Projekt ohne Verbindung zur CIA oder zur US-Regierung
Überblick
- Ein Datenarchiv, das 36 Jahre geopolitischer Informationen bewahrt und strukturiert
- Basiert auf aus dem ursprünglichen CIA World Factbook geparsten Daten
- Umfasst 281 Entitäten, 36 Ausgaben, 9.500 Länder-Jahr-Einträge und 1.061.341 Datenfelder
- Alle Daten sind durchsuchbar, und Änderungen in Länderberichten lassen sich über die Jahre hinweg nachverfolgen
Plattformaufbau
- Factbook Archive / Reference Library
- Alle Ausgaben von 1990 bis 2025 können eingesehen werden
- Zeigt die ursprünglichen Felddaten unverändert an und ermöglicht die Suche nach Veränderungen über die Jahre hinweg
- Intelligence Analysis / Analytic Workspace
- Ein nach DoD Combatant Commands (COCOM) gegliederter Analyse-Workspace
- Bietet Choropleth-Karten, Zeitreihenvergleiche, länderspezifische Analysedossiers (im ICD-203-Format) und Vergleichsfunktionen zwischen Indikatoren
Hauptfunktionen
- Library: Klassifiziert alle Entitäten nach Typ, einschließlich Flaggen
- Country Profile: Einsicht in die vollständigen Felddaten jedes Landes
- Full-Text Search: Schlüsselwortsuche in mehr als 1 Million Feldern mit Z39.58-Syntax
- Field Time Series: Verfolgt die Entwicklung eines bestimmten Datenfelds über 36 Jahre
- Factbook Quiz: Weltwissens-Quiz in 4 Modi
- Factbook Export: Erstellt druckbare Länderberichte mit allen Feldern
Intelligence-Analysetools
- Regional Dashboard: Weltkarte mit COCOM-Regionen und markierten Hauptstädten
- Timeline Map: Visualisiert 36 Jahre Daten in animierter Form
- Communications Analysis: Zeigt Kennzahlen zur Verbreitung von Internet, Mobilfunk und Breitband
- Map Compare: Vergleicht synchronisierte Karten aus zwei Jahren
- COCOM Region Detail: Zeigt zentrale Leistungsindikatoren (KPI) je Region
- Intelligence Dossier: Länderspezifisches Analysedossier nach ICD-203-Standard
- Global Rankings: Sortiert Länder nach Indikatoren
- Global Trends: Weltweite Indikatortrends über alle Ausgaben hinweg
- Compare Countries: Vergleicht Indikatoren zwischen Ländern
- Field Explorer: Durchsucht alle Datenfelder und Abdeckungsstatistiken
- Change Detection: Erkennt Feldänderungen nach Jahr
- Dissolved States: Informationen zu Staaten und Regionen, die nicht mehr existieren
- Trade Networks: Netzwerkgraphen zu Handelsbeziehungen
- Organization Networks: Graphen zu Mitgliedschaften in internationalen Organisationen
- Query Builder: Erstellt benutzerdefinierte Analyseabfragen
- Text Diff: Vergleicht Texte zwischen Jahren und hebt Änderungen hervor
Projektinformationen
- Alle Daten wurden aus Public-Domain-Material der US-Regierung (CIA World Factbook) gesammelt
- Keine Verbindung zur CIA oder zur US-Regierung
- Die Analyse folgt den ICD-203-Analysestandards
- Quellcode und Methodik sind über das GitHub-Repository offengelegt
1 Kommentare
Hacker-News-Kommentare
Es wäre wirklich großartig, wenn die nächste Regierung diese archivierten Daten nutzen würde, um es wieder aufzubauen.
Jemand stellt ein Projekt vor, die Community findet in Echtzeit Bugs, und der Ersteller behebt sie sofort.
Das Problem mit kollidierenden FIPS- und ISO-Ländercodes ist ein gutes Beispiel dafür, dass man solche seltenen Bugs nur mit vielen Augen findet.
Beeindruckend ist auch, dass der Ersteller nicht defensiv reagiert hat, sondern aktiv auf das Feedback eingegangen ist.
Es wird als „Cache des Datensatzes der Länderprofile im Originalformat von CIA.gov (1:1)“ beschrieben.
Detaillierte Daten gibt es unter cache.factbook.json.
Ich fand nur, dass es nötig ist, die Daten von 1990 bis 2025 in eine SQL-Datenbank zu überführen, damit man sie abfragen kann.
Dieser Datensatz eignet sich sehr gut für GraphRAG-Funktionstests.
Man könnte damit wahrscheinlich auch ein Welt-Simulationsspiel auf Basis realer Daten bauen.
Der ursprünglich von der CIA veröffentlichte Inhalt bleibt unverändert, und ich bereinige beim Parsen nur Formatierungsrauschen.
Zusätzlich habe ich eine Lookup-Tabelle erstellt, die FIPS-10-4-Codes, ISO Alpha-2/3 und MasterCountryID aufeinander abbildet, damit sie miteinander verknüpft werden können.
Diese Materialien werde ich ebenfalls auf GitHub hinzufügen.
Wenn man im Factbook 2002 auf „Germany“ klickt, landet man jedes Mal auf der Seite von „Gambia“.
Bei anderen Ländern habe ich dieses Verhalten nicht gesehen.
Amazon-Link
Das lässt sich auf der Seite zur Trendanalyse sehen.
Danke für den Hinweis!
Beispiel: Daten zu festen Breitbandanschlüssen in Indien
So wurde zum Beispiel „18.17 million“ nur als 18.17 erkannt, was den Fehler mit dem starken Einbruch im Diagramm verursachte.
Ich habe die Behandlung der Einheiten ergänzt, den Bug behoben und das Update gerade ausgerollt.
Danke für den Hinweis.