3 Punkte von GN⁺ 2023-09-16 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Der Autor beschreibt seine Lieblings-API, nämlich die zipfile auf der Website der Europäischen Zentralbank, die historische Daten dazu bereitstellt, wie der Euro im Verhältnis zu anderen Währungen stand.
  • Der Autor zeigt, wie man mit verschiedenen Tools wie curl, gunzip, sqlite3 und pandas Daten aus der zipfile herunterlädt, entpackt und abfragt.
  • Die aus der zipfile gewonnenen Daten liegen im „wide“-Format vor, mit einer Datumsspalte und zusätzlichen Spalten für jede Währung, was sich nicht ideal für Filter und Aggregationen eignet.
  • Der Autor zeigt mit pandas, wie die Daten vom „wide“- in das „long“-Format umgewandelt werden, also per „melting“.
  • Der Autor weist außerdem auf ein Problem in den Daten hin: Ein nachgestelltes Komma am Ende jeder Zeile stört den Melting-Prozess. Das wird gelöst, indem in der pandas-Methodenkette .iloc[:, :-1] ergänzt wird.
  • Der Autor räumt ein, dass beim Umgang mit diesen Daten etwas „Data Preparation“ nötig ist, merkt jedoch an, dass sich die ECB-Wechselkursdaten im Vergleich zu anderen Open-Data-Veröffentlichungen relativ leicht verarbeiten lassen.
  • Anschließend zeigt der Autor, wie die bereinigten Daten in eine csvbase-Tabelle hochgeladen und mit gnuplot grafisch dargestellt werden können.
  • Der Autor stellt außerdem DuckDB vor, ein sqlite-ähnliches, aber spaltenorientiertes Tool, und zeigt, wie man es nutzt, um CSV-Dateien direkt über HTTP in eine Tabellendatei zu laden.
  • Der Autor betont, dass Open Data auch wie eine offene API funktionieren kann, und lobt die Einfachheit der zipfile der EZB als Format für den Datenaustausch.
  • Der Autor gibt außerdem einen kurzen Überblick über die Geschichte des Euro und erklärt, warum er bei seiner Einführung im Jahr 2000 gegenüber dem Dollar schwach war.

Noch keine Kommentare.

Noch keine Kommentare.