Tuplex – Framework für parallele Big-Data-Verarbeitung

xguru · 2021-07-09T09:20:53+09:00

Bietet eine Python-API ähnlich wie Apache Spark / Dask, aber → ruft den Python-Interpreter nicht auf → erzeugt LLVM-Bytecode, der für die gegebene Pipeline und den Eingabedatensatz optimiert ist → 5–91x schneller als der Interpreter Intern basiert es auf datengesteuerter Kompilierung und Dual-Mode-Verarbeitung und erreicht Geschwindigkeiten, die denen von in C++ geschriebenen und optimierten Pipelines ähneln Unterstützt MacOS / Linux Das auf der SIGMOD '21 vorgestellte Paper "Tuplex: Data Science in Python at Native Code Speed"

(github.com)

11 Punkte von xguru 2021-07-09 | Noch keine Kommentare. | Auf WhatsApp teilen

Bietet eine Python-API ähnlich wie Apache Spark / Dask, aber

→ ruft den Python-Interpreter nicht auf

→ erzeugt LLVM-Bytecode, der für die gegebene Pipeline und den Eingabedatensatz optimiert ist

→ 5–91x schneller als der Interpreter

Intern basiert es auf datengesteuerter Kompilierung und Dual-Mode-Verarbeitung und erreicht Geschwindigkeiten, die denen von in C++ geschriebenen und optimierten Pipelines ähneln
Unterstützt MacOS / Linux
Das auf der SIGMOD '21 vorgestellte Paper "Tuplex: Data Science in Python at Native Code Speed"

Tuplex – Framework für parallele Big-Data-Verarbeitung

Verwandte Beiträge

Noch keine Kommentare.