S3 Express ist alles, was Sie brauchen
(warpstream.com)- AWS’ neue Storage-Klasse mit niedriger Latenz, "S3 Express One Zone", erhält in der Data-Infrastructure-Community viel Aufmerksamkeit
- Der Datenzugriff ist 10-mal schneller, die Kosten für API-Requests sind 50 % günstiger. Es können mehrere Millionen Requests pro Minute verarbeitet werden
- Die Storage-Klasse S3 Express ist pro GiB 8-mal teurer als das bisherige S3 Standard und daher als "primärer" Speicher für große Datensysteme ungeeignet
- Die Kosten für API-Operationen sind zwar 50 % günstiger, aber nicht extrem niedrig, sodass sie weiterhin nicht zu Workloads passen, die zuvor wegen der Kosten der S3-API unpraktisch waren
- S3 Express berechnet für alle API-Operationen über 512 KiB (Schreiben + Lesen) Gebühren pro GiB
- Anders gesagt: Jede API-Operation enthält 512 KiB "kostenlose" Bandbreite, und erst darüber hinaus fallen Kosten an
- Da es sich jedoch um eine One-Zone-Storage-Klasse handelt, müssen Datensysteme ihre Daten manuell in zwei AZs replizieren, um gegen den Ausfall einer einzelnen AZ gewappnet zu sein
- Die Kosten für das zweimalige Schreiben von Daten in zwei AZs sind ähnlich hoch wie die Kosten für die manuelle Replikation von Daten auf Anwendungsebene
Neue Chancen für moderne Dateninfrastruktur
- Die neue Storage-Klasse eröffnet neue Möglichkeiten, mit derselben Architektur und demselben Code zwischen niedriger Latenz bei hohen Kosten und hoher Latenz bei niedrigen Kosten abzuwägen
- Alle modernen Datensysteme müssen nun nicht mehr abhängig von der Verfügbarkeit lokaler Festplatten oder von Block Storage (EBS) entworfen werden, sondern können vollständig auf Object Storage basieren
- Daten können einfach in einem Bucket mit S3 Express und niedriger Latenz gespeichert und anschließend asynchron in einen S3-Standard-Bucket verschoben werden. Da die meisten modernen Datensysteme bereits Komprimierungsfunktionen besitzen, ist "Storage Tiering" praktisch kostenlos
Meinung von GN⁺
Der wichtigste Punkt dieses Artikels ist der Ausblick darauf, welche Veränderungen AWS’ neue Storage-Klasse S3 Express One Zone für die Dateninfrastruktur bringen könnte. Diese Storage-Klasse eröffnet neue Chancen, Kosten und Leistung von Datensystemen grundlegend zu verbessern, und könnte dadurch die Art und Weise, wie Daten verwaltet und gespeichert werden, revolutionieren. Insbesondere die Möglichkeit, alle Datensysteme rund um Object Storage aufzubauen, dürfte für viele Unternehmen und Entwickler eine attraktive Option sein. Es ist zu erwarten, dass diese Veränderung die Zukunft der Dateninfrastruktur flexibler und kosteneffizienter machen wird.
3 Kommentare
Ich bin gespannt, wie es genutzt werden wird.
Ich hatte erst gestern noch einmal nach WarpStream gesucht, deshalb füge ich den Link bei
https://de.news.hada.io/topic?id=10234
Hacker-News-Kommentare
Die meisten produktiven Speichersysteme/Datenbanken auf S3-Basis investieren erheblichen Aufwand in den Aufbau einer SSD-/Memory-Caching-Schicht, um produktive Performance zu erreichen.
Die AWS-S3-Express-Speicherkosten sind 8-mal höher als bei S3 Standard, aber für moderne Datenspeichersysteme ist das kein Problem.
Vor ein paar Wochen haben wir S3 Express bei der Suchmaschine Quickwit getestet.
Als zusätzlicher Kontext: warpstream baut ein Kafka-kompatibles Streaming-System, das S3 als Object Storage verwendet.
Ich habe das Problem gelöst, indem ich Dateien lokal in Redis gecacht habe, bevor ich sie zu S3 hochgeladen habe.
Ich verstehe nicht, warum EFS nicht mehr Aufmerksamkeit bekommt, obwohl es S3 weit überlegen ist.
Ich frage mich, ob die Formulierung „X is all you Need“ erstmals im Paper „Attention is all you need“ verwendet wurde.
Falls das ein in Rust geschriebenes S3 mit niedriger Latenz ist, dann ist es nach mehreren Jahren Entwicklung endlich veröffentlicht worden.
Ich frage mich, für welche Use Cases die neue S3-Express-Schicht die Performance verbessert und ob die 8-fachen Mehrkosten es wert sind.
Viele S3-Implementierungen wirken wie ein transparenter Download auf die Festplatte, aber tatsächlich ist es nicht einfach so, dass man „das Netzwerk als Festplatte benutzt“.