19 Punkte von minsuchae 2025-11-18 | 16 Kommentare | Auf WhatsApp teilen

🚨 Globales Netzwerkproblem bei Cloudflare

  • In Untersuchung (vor 47 Minuten): Cloudflare ist sich eines weit verbreiteten Problems mit 500-Fehlern sowie Ausfällen des Dashboards/der API bewusst, das zahlreiche Kunden betrifft, und untersucht den Vorfall.

  • Update (vor 32 Minuten): Das Problem wird weiterhin untersucht.

  • Wiederherstellung läuft (vor 14 Minuten): Die Dienste werden wiederhergestellt, aber während der laufenden Arbeiten können Kunden weiterhin eine höhere Fehlerrate als üblich beobachten.

Derzeit kam es unter anderem bei Twitter zu einem großflächigen Ausfall; die CDN-Funktionalität wurde zwischenzeitlich wiederhergestellt.

16 Kommentare

 
jjpark78 2025-11-19

Hardening der Aufnahme von von Cloudflare generierten Konfigurationsdateien auf die gleiche Weise, wie wir es bei nutzergenerierten Eingaben tun würden

Das scheint eine gute Lehre zu sein.

Auf Eingabewerte von Nutzern wenden wir alle möglichen Prüfungen an,

doч bei kritischen Daten, die intern erzeugt wurden, validieren wir in Wirklichkeit oft nicht in diesem Ausmaß.

Je größer eine Organisation wird, desto eher kann so etwas übersehen werden, selbst wenn es dokumentiert ist, und wenn die großzügig gesetzte Größe eine Zeit lang keine Probleme macht, man es vergisst und dann irgendwann die Begrenzung überschritten wird,
dann ist das wirklich der totale Horror...

 
jamiecha 2025-11-19

https://blog.cloudflare.com/18-november-2025-outage/…
Am Ende ist es bei einem etwas nachlässig behandelten unwrap() hochgegangen, aber da schon die Annahme über die Größe der Konfigurationsdatei selbst nicht mehr galt, kann man ihm nicht allein die Schuld geben. Auf der Seite, die die Konfigurationsdatei „erzeugt“, hätte es Code geben müssen, der prüft, ob diese Annahme eingehalten wird; vielleicht war einfach ein anderes Team dafür zuständig und hat das Size-Limit deshalb nicht als besonders wichtig angesehen?

 
jjpark78 2025-11-19

https://blog.cloudflare.com/18-november-2025-outage/

Trotzdem werde ich Cloudflare wohl weiter nutzen – dank solcher ehrlichen Postmortem-Berichte.

Wäre es ein inländisches Unternehmen, würden sie wohl behaupten, nordkoreanische Hacker seien schuld..

 
onestone 2025-11-19

In letzter Zeit scheint es, als würde man Störungen bei Cloud-bezogenen Diensten immer häufiger beobachten.

 
quack337 2025-11-19

Ah! Heute früh war ich ganz schön irritiert, weil der git clone-Befehl für GitHub-Repos nicht funktionierte,
dann lag das wohl an diesem Vorfall.

 
minsuchae 2025-11-19

Die vollständige Wiederherstellung war offenbar 6 Stunden nach Beginn der Störung abgeschlossen.
Update
Cloudflare-Services funktionieren derzeit normal. Wir beobachten im Netzwerk keine erhöhte Fehlerquote oder Latenz mehr.

Unsere Engineering-Teams überwachen die Plattform weiterhin genau und führen eine eingehendere Untersuchung der vorherigen Störung durch, derzeit werden jedoch keine Konfigurationsänderungen vorgenommen.

Zum jetzigen Zeitpunkt gilt es als sicher, alle Cloudflare-Services wieder zu aktivieren, die während des Vorfalls vorübergehend deaktiviert wurden. Wir werden ein abschließendes Update bereitstellen, sobald unsere Untersuchung abgeschlossen ist.
Veröffentlicht vor 28 Minuten. 18. Nov. 2025 - 17:44 UTC

 
jic5760 2025-11-19

Bis gerade eben kam ich auch nicht ins Dashboard rein, jetzt geht es aber.

 
kimjoin2 2025-11-19

Der Dienst war etwa drei Stunden lang ausgefallen.

 
lsdcnu 2025-11-18

Das ging schnell.

 
rkjun 2025-11-18

Das ist wirklich übel. Hoffentlich ist es schnell wiederhergestellt ... aber es dauert wohl doch nicht so kurz, bis es sich erholt .. 😢

 
galadbran 2025-11-18

Beim letzten großflächigen Ausfall blieb Twitter verschont und erhielt viel Lob, aber diesmal konnte selbst Twitter dem Ausfall nicht entgehen ...

 
bbulbum 2025-11-18

Hahaha, ich habe auch gesehen, dass Dienste im Zusammenhang mit Cloudflare ausgefallen waren, und bin deshalb zuerst zu GeekNews gekommen.
Danke für die schnelle Berichterstattung.
Ein Fehler bei einem CDN, das ganz vorne in der Service-Kette sitzt, hat wirklich enorme Auswirkungen.
Entwickler können bei so einer Situation zwar ungefähr einschätzen, wo das Problem liegt, aber Nutzer werden es wohl als Problem des Dienstes selbst verstehen. Solche Ausfälle bei Infrastruktur-Diensten scheinen in vielerlei Hinsicht wirklich nicht einfach zu sein.

 
bbulbum 2025-11-18

Wenn man darüber nachdenkt, ist es wohl auch ein Fehler, dass man einen Single Point of Failure nicht abfangen konnte ...

 
crawler 2025-11-18

Als ich gesehen habe, dass die Server ausgefallen sind, bin ich sofort zuerst zu GeekNews gekommen.
Wie erwartet war schon ein Beitrag dazu oben, haha.
Ich bin gespannt, was diesmal der Grund ist.

 
laeyoung 2025-11-18

Ich hatte gehört, dass Claude Code Web kurzzeitig nicht erreichbar war, aber es lag wohl an einer Störung bei Cloudflare.