xsv – CSV-Dateiverarbeitungstool für die CLI
(github.com)Ein CLI-Tool, mit dem sich CSV-Dateien wie eine DB verwenden lassen. Rust-Open-Source.
Dateien zusammenführen, Zeilen zählen, feste Breite erzeugen, neu formatieren (z. B. Trennzeichen ändern),
join (inner, outer, cross), Spaltenwert-Partitionierung, Sampling, umgekehrte Reihenfolge, bestimmte Spalten extrahieren, Spalten neu anordnen,
sortieren, aufteilen (in N Dateien), stats (Durchschnitt, Varianz, Median, Bereich usw. pro Spalte), als Tabelle anzeigen
2 Kommentare
Spark lokal?!
Scheint nützlich zu sein, wenn man bei der Datenanalyse CSV-Daten bereinigen will.
Beispiel für einen Join im SQL-Stil – https://www.johndcook.com/blog/2019/12/31/sql-join-csv-files/