4 Punkte von xguru 2020-01-02 | 2 Kommentare | Auf WhatsApp teilen

Ein CLI-Tool, mit dem sich CSV-Dateien wie eine DB verwenden lassen. Rust-Open-Source.

Dateien zusammenführen, Zeilen zählen, feste Breite erzeugen, neu formatieren (z. B. Trennzeichen ändern),

join (inner, outer, cross), Spaltenwert-Partitionierung, Sampling, umgekehrte Reihenfolge, bestimmte Spalten extrahieren, Spalten neu anordnen,

sortieren, aufteilen (in N Dateien), stats (Durchschnitt, Varianz, Median, Bereich usw. pro Spalte), als Tabelle anzeigen

2 Kommentare

 
iolothebard 2020-01-02

Spark lokal?!

 
xguru 2020-01-02

Scheint nützlich zu sein, wenn man bei der Datenanalyse CSV-Daten bereinigen will.

Beispiel für einen Join im SQL-Stil – https://www.johndcook.com/blog/2019/12/31/sql-join-csv-files/