Sammlung von Post-Mortems
(github.com)Lernen aus Analyseberichten von IT-Unternehmen zur Behebung von Störungen (ca. 150+)
-
Konfigurationsfehler bei Routern/LB/Cloud usw.: viele Beispiele, darunter Google und Travis CI
-
Hardware-/Stromfehler: Cloud- und Rechenzentren, darunter Amazon und Google
-
Verschiedene Konfliktprobleme: GitHub, Google
-
Zeitbezogene Probleme wie Zertifikatsdaten und Schaltsekunden
-
Sonstiges
→ verschiedenste menschliche Fehler
→ Probleme, die durch eine einzige Codezeile oder fehlerhafte Logs verursacht wurden
→ DDoS
→ Probleme bei der Berechtigungsverwaltung
- Enthält außerdem viele Links zu weiteren Post-Mortem-Sammlungen
Noch keine Kommentare.