-
Geplant ist die Veröffentlichung eines Verfügbarkeitsberichts jeweils am ersten Mittwoch des Monats, der Erklärungen zu bisherigen Vorfällen, technische Hintergründe und Lösungsmaßnahmen zusammenfasst
-
Ziel ist es, durch vollständige Transparenz nicht nur einfache Fehlerberichte zu liefern, sondern allen zu ermöglichen, aus diesen Erfahrungen zu lernen
-
GitHubs Reaktion auf die in letzter Zeit häufiger auftretenden Website-Ausfälle
-
5/5 (Ausfall von 2:24 Minuten)
Verursacht dadurch, dass die Auto-Increment-ID einer bestimmten MySQL-Tabelle den Maximalwert des Integer-Typs überschritten hat
Es werden Benachrichtigungen ausgelöst, wenn die PK-Größe 70 % überschreitet, und ein Linter wurde hinzugefügt, damit das Test-Framework int/bigint prüft
- 5/22 (Ausfall von 5:09 Minuten)
Während regelmäßiger Wartungsarbeiten fiel der neu gestartete primäre MySQL-Server aus. Der Traffic wurde eilig auf den ursprünglichen Primary umgeleitet, doch da dieser während eines 6-sekündigen Ausfalls Write-Traffic angenommen hatte, dauerte es 4 Stunden, ihn aus einem Replikat wiederherzustellen, und 1 weitere Stunde, um den Cluster neu zu konfigurieren.
Um die Wiederherstellungszeit zu minimieren, wird die Automatisierung des Failovers weiterhin getestet
- 6/19 (Ausfall von 51 Minuten)
Eine für verbesserte A/B-Tests eingeführte Änderung verursachte das Problem, weil sie eine Abhängigkeit zu Dateien anderer dynamisch erzeugter Applikationen hatte. Während des Deployments schlug die Erstellung dieser Datei fehl, wodurch ein Rate Limit ausgelöst wurde.
Die Konfigurationen für A/B- und multivariate Tests wurden so geändert, dass sie intern gecacht werden
1 Kommentare
Es stand der Verdacht im Raum, dass seit der Übernahme durch MS deutlich mehr Fehler auftreten.
(Vielleicht ist man auch zusammengezuckt, weil das schnell in die Richtung „Ist Azure nicht stabil?“ weitergeführt wurde.)
Dazu hat man nun als direkten und transparenten Gegenansatz angekündigt, regelmäßig Verfügbarkeitsberichte zu veröffentlichen.
Ich finde, auch Unternehmen in Korea sollten sich eine solche Art des Umgangs abschauen.
Das ist zwar ein etwas anderes Thema, aber wenn man die „Transparenzberichte“ ausländischer und koreanischer Unternehmen vergleicht, gibt es qualitativ wie quantitativ enorme Unterschiede.
Transparenzbericht (Transparency Report): Das Teilen von Daten, die zeigen, welche Auswirkungen staatliche und unternehmerische Richtlinien und Maßnahmen auf Datenschutz, Sicherheit und die Nutzung von Informationen haben.
Google-Transparenzbericht: https://transparencyreport.google.com/?hl=ko
Facebook-Transparenzbericht: https://transparency.facebook.com/
Naver-Transparenzbericht: https://privacy.naver.com/transparency/transparency_report_statistic/…
Kakao-Transparenzbericht: https://privacy.kakao.com/transparency/statistic
Es sollte meiner Meinung nach nicht dabei bleiben, einfach nur Daten aufzulisten;
vielmehr sollte der Bericht selbst so gestaltet sein, dass die Überzeugungen des Unternehmens gut darin zum Ausdruck kommen.