8 Punkte von xguru 2020-07-20 | 1 Kommentare | Auf WhatsApp teilen

Ein Subsystem, das indexbasierte Abfragebeschleunigung für Apache Spark ermöglicht

→ Erstellt und verwaltet Indizes für CSV-, JSON- und Parquet-Daten

→ Nutzt diese Indizes automatisch, um Abfragen/Workloads ohne Codeänderungen zu beschleunigen

  • Im TPC-Benchmark wurde die Geschwindigkeit einzelner Abfragen um bis zu das 11-Fache erhöht

→ Insgesamt etwa doppelte Abfrageleistung auf Standardhardware

  • Einfache APIs wie create, refresh, delete, restore, vacuum, cancel

  • Unterstützung für Scala, Python und .NET

Wird in Azure Synapse Analytics der Microsoft-Azure-Cloud eingesetzt

(ein unbeschränkter Analysedienst, der Enterprise Data Warehousing und Big-Data-Analyse kombiniert)

1 Kommentare

 
xguru 2020-07-20

Einführung: Hyperspace, ein Indexierungs-Subsystem für Apache Spark™, ist jetzt Open Source

https://cloudblogs.microsoft.com/opensource/2020/…