16 Punkte von xguru 2020-10-13 | Noch keine Kommentare. | Auf WhatsApp teilen

Lernen aus Analyseberichten von IT-Unternehmen zur Behebung von Störungen (ca. 150+)

  • Konfigurationsfehler bei Routern/LB/Cloud usw.: viele Beispiele, darunter Google und Travis CI

  • Hardware-/Stromfehler: Cloud- und Rechenzentren, darunter Amazon und Google

  • Verschiedene Konfliktprobleme: GitHub, Google

  • Zeitbezogene Probleme wie Zertifikatsdaten und Schaltsekunden

  • Sonstiges

→ verschiedenste menschliche Fehler

→ Probleme, die durch eine einzige Codezeile oder fehlerhafte Logs verursacht wurden

→ DDoS

→ Probleme bei der Berechtigungsverwaltung

  • Enthält außerdem viele Links zu weiteren Post-Mortem-Sammlungen

Noch keine Kommentare.

Noch keine Kommentare.