Analyse des Internet-Ausfalls von CenturyLink/Level(3) am 30. August
(blog.cloudflare.com)-
Analyse der großflächigen Internet-Störung gestern Nachmittag
-
Zunächst wurde ein Problem bei Cloudflare vermutet, tatsächlich stellte sich jedoch eine Störung bei CenturyLink heraus, einem der größten ISPs der Welt
-
Ein fehlerhaftes Flowspec-Update verursachte ein Problem bei BGP (Border Gateway Protocol)
→ Flowspec ist eine Erweiterung von BGP und ein Werkzeug, mit dem sich Firewall-Regeln schnell im Netzwerk verbreiten lassen
(Cloudflare sagt, dass sie Flowspec nicht mehr verwenden, nachdem es vor 7 Jahren bereits einmal dadurch zu einem Ausfall kam)
→ BGP-Updates, die normalerweise etwa 1,5 bis 2 MB groß sind, überschritten mit diesem Flowspec plötzlich 20 MB, wodurch das Problem entstand
- Cloudflares Vermutung, warum die Wiederherstellung ganze 4 Stunden dauerte
→ Durch die Flowspec-Regeln entstanden sehr große BGP-Updates, wodurch der Zugriff auf die Router unmöglich geworden sein könnte
→ Vermutlich entstand das Problem, weil diese Flowspec-Regel nicht von CenturyLink selbst, sondern von einem ihrer Kunden kam, was die Ursachensuche erschwerte
→ Der Vorfall ereignete sich am Sonntagvormittag US-Zeit, außerdem ist das CenturyLink/Level(3)-Netzwerk extrem groß und komplex
- Durch diese Netzwerkstörung waren gestern Verbindungen zu zahlreichen Online-Spielen wie LoL, PSN, Xbox Live, Steam und WoW nicht möglich
3 Kommentare
In diesem Zusammenhang wurde ein professionelles League-of-Legends-Spiel unterbrochen und deshalb nicht auf dem dedizierten Turnierserver, sondern auf dem regulären Server fortgesetzt.
[LCK PO 2R] Das unterbrochene Gen.G vs. DRX wurde mit den verbleibenden Sätzen auf dem Live-Server fortgesetzt - http://www.inven.co.kr/webzine/news/?news=243826&site=lol
Uff, wenn das während eines Spiels passiert wäre, wäre das ziemlich unerquicklich gewesen.
Ist BGP sicher? https://de.news.hada.io/topic?id=1932