- Bietet eine Python-API ähnlich wie Apache Spark / Dask, aber
→ ruft den Python-Interpreter nicht auf
→ erzeugt LLVM-Bytecode, der für die gegebene Pipeline und den Eingabedatensatz optimiert ist
→ 5–91x schneller als der Interpreter
-
Intern basiert es auf datengesteuerter Kompilierung und Dual-Mode-Verarbeitung und erreicht Geschwindigkeiten, die denen von in C++ geschriebenen und optimierten Pipelines ähneln
-
Unterstützt MacOS / Linux
-
Das auf der SIGMOD '21 vorgestellte Paper "Tuplex: Data Science in Python at Native Code Speed"
Noch keine Kommentare.