- Der Autor beschreibt seine Lieblings-API, nämlich die zipfile auf der Website der Europäischen Zentralbank, die historische Daten dazu bereitstellt, wie der Euro im Verhältnis zu anderen Währungen stand.
- Der Autor zeigt, wie man mit verschiedenen Tools wie
curl, gunzip, sqlite3 und pandas Daten aus der zipfile herunterlädt, entpackt und abfragt.
- Die aus der zipfile gewonnenen Daten liegen im „wide“-Format vor, mit einer Datumsspalte und zusätzlichen Spalten für jede Währung, was sich nicht ideal für Filter und Aggregationen eignet.
- Der Autor zeigt mit
pandas, wie die Daten vom „wide“- in das „long“-Format umgewandelt werden, also per „melting“.
- Der Autor weist außerdem auf ein Problem in den Daten hin: Ein nachgestelltes Komma am Ende jeder Zeile stört den Melting-Prozess. Das wird gelöst, indem in der
pandas-Methodenkette .iloc[:, :-1] ergänzt wird.
- Der Autor räumt ein, dass beim Umgang mit diesen Daten etwas „Data Preparation“ nötig ist, merkt jedoch an, dass sich die ECB-Wechselkursdaten im Vergleich zu anderen Open-Data-Veröffentlichungen relativ leicht verarbeiten lassen.
- Anschließend zeigt der Autor, wie die bereinigten Daten in eine
csvbase-Tabelle hochgeladen und mit gnuplot grafisch dargestellt werden können.
- Der Autor stellt außerdem DuckDB vor, ein sqlite-ähnliches, aber spaltenorientiertes Tool, und zeigt, wie man es nutzt, um CSV-Dateien direkt über HTTP in eine Tabellendatei zu laden.
- Der Autor betont, dass Open Data auch wie eine offene API funktionieren kann, und lobt die Einfachheit der zipfile der EZB als Format für den Datenaustausch.
- Der Autor gibt außerdem einen kurzen Überblick über die Geschichte des Euro und erklärt, warum er bei seiner Einführung im Jahr 2000 gegenüber dem Dollar schwach war.
Noch keine Kommentare.