- Dieser Artikel stellt WarpStream vor, eine direkt auf S3 aufgebaute Daten-Streaming-Plattform mit Kafka-Protokollkompatibilität.
- WarpStream wird als einzelnes, zustandsloses Go-Binary bereitgestellt und macht damit die Verwaltung lokaler Datenträger, das Rebalancing von Brokern und den Betrieb von ZooKeeper überflüssig.
- Durch das direkte Streamen von Daten nach S3 senkt die Plattform die Infrastrukturkosten erheblich und ist in der Cloud 5- bis 10-mal günstiger als Kafka.
- Der Artikel kritisiert die Eignung von Kafka für moderne Workloads und hebt insbesondere die hohen Inter-AZ-Bandbreitenkosten und den operativen Overhead hervor.
- Die Architektur von WarpStream unterscheidet sich von Kafka. Statt Brokern gibt es zustandslose „Agents“, die als „Leader“ für beliebige Topics fungieren, Offsets für beliebige Consumer-Gruppen committen oder als Koordinatoren des Clusters arbeiten können.
- In WarpStream wird sämtlicher Speicher an Objektspeicher wie S3 ausgelagert, was einfache Skalierung und schnelle Wiederherstellung nach Ausfällen ermöglicht.
- WarpStream trennt Daten und Metadaten und speichert die Metadaten aller „virtuellen Cluster“ in einer benutzerdefinierten Metadaten-Datenbank.
- Die Plattform senkt die Gesamtkosten der meisten Kafka-Workloads um das 5- bis 10-Fache, hat dafür aber eine höhere Latenz mit einem P99 von etwa 400 ms für Produce-Requests und rund 1 Sekunde vom Producer bis zum Consumer.
- WarpStream befindet sich derzeit in der Developer Preview und ist noch nicht für den produktiven Einsatz bereit.
- Die Entwickler von WarpStream sehen ein Problem in der Developer-UX von Kafka und nennen insbesondere die Low-Level-Abstraktion von Partitionen als Schwachstelle. Sie planen, dies in künftigen Updates von WarpStream zu beheben.
- Der Artikel endet mit der Einladung an die Leser, WarpStream auszuprobieren und Feedback zu geben.
1 Kommentare
Hacker-News-Kommentare