- Verarbeitung von named-index-Daten wie CSV, TSV und tabellarischem JSON
→ bietet für Key-Value-Daten Funktionen wie awk, sed, cut, join und sort
- Nützlich für Datenbereinigung und -reduktion, Statistikerstellung, DevOps, Systemadministration, Logdateiverarbeitung, Dateiformatkonvertierung und Post-Processing von DB-Abfragen
→ ein Helfer für die Verarbeitung von R-, Pandas- und SQL-Output
-
Unterstützt Streaming und lässt sich gut in Unix-Pipes integrieren
-
Verarbeitet Daten intern mit einer insertion-ordered Hash Map
-
Open Source: anfangs in C geschrieben, ab 6.0 auf Go umgestellt
2 Kommentare
Ich brauche es zwar nicht oft, aber selbst wenn ich es nur ab und zu mit der Anleitung daneben benutze, ist es besser als jedes andere Tool, das ich bisher verwendet habe!
Gefällt mir. Wenn man große CSV-Dateien ad hoc verarbeiten muss, gab es bisher kaum ein wirklich passendes Tool, und es wirkt auch einfach zu benutzen.