- Haltbarkeitskennzahlen von EBS gp3: Laut offizieller AWS-Dokumentation liegt die Annual Failure Rate (AFR) bei 0,1 % bis 0,2 %. Die Haltbarkeit einer einzelnen Festplatte ist mit 99,9 % sehr hoch, doch mit wachsender Infrastrukturgröße summiert sich das probabilistische Risiko.
- Wahrscheinlichkeit von Ausfällen je nach Größenordnung:
- Beim Betrieb von 1.000 Festplatten liegt die Wahrscheinlichkeit, dass innerhalb eines Jahres überhaupt kein Ausfall auftritt, bei etwa 36,8 % ($0.999^{1000}$).
- Das bedeutet: Statistisch gesehen erlebt man mit einer Wahrscheinlichkeit von etwa 63,2 % mindestens einen Festplattenausfall, ein Risiko auf einem Niveau, das man beim Design als Konstante behandeln sollte.
- Veränderung der Überlebensrate je nach Speicherstruktur:
- Verteilte Struktur (Sharding/RAID 0): Die Haltbarkeit des Gesamtsystems wird als Produkt der Haltbarkeit der einzelnen Komponenten ($R^n$) bestimmt. Mit steigender Anzahl an Festplatten sinkt die Überlebenswahrscheinlichkeit des Systems exponentiell.
- Replikationsstruktur (Mirroring/RAID 1): Indem die Ausfallwahrscheinlichkeit pro Shard quadriert ($Q^2$) wird, lässt sich selbst mit derselben Hardware die Gesamthaltbarkeit des Systems sprunghaft verbessern.
- Trennung der Management-Strategien:
- Redundancy (RAID usw.): Eine Strategie, um auf mechanische Ausfälle physischer Hardware zu reagieren und dabei Service-Verfügbarkeit und Haltbarkeit aufrechtzuerhalten.
- Backup (S3-Snapshots usw.): Das einzige Mittel, um sich von „logischer Verfälschung von Daten“ durch Bedienfehler, Software-Bugs, Ransomware usw. zu erholen. Beides ist nicht gegenseitig ersetzbar.
- Fazit: Dass Cloud-Managed-Services eine hohe Stabilität bieten, stimmt zwar, doch die endgültige Haltbarkeit eines Systems wird weniger durch die Spezifikationen einzelner Komponenten als durch die Fähigkeit des Engineers zum Architekturdesign bestimmt.
1 Kommentare
Vielen Dank, ich habe den Beitrag gern gelesen. ^^
Gerade da sollte man eigentlich nicht sparen, haha