1 Punkte von GN⁺ 2024-11-27 | 1 Kommentare | Auf WhatsApp teilen
  • Diese Seite stellt Updates zu globalen Vorfällen bereit. Alltägliche Hardwareausfälle oder begrenzte Infrastrukturvorfälle sind nicht enthalten.
  • Um alle Vorfälle zu sehen, die sich auf personalisierte Apps auswirken könnten, können Sie im Dashboard Ihrer Fly Organization eine personalisierte Statusseite einsehen.

Frühere Vorfälle

27. November 2024

  • Keine Vorfälle gemeldet

26. November 2024

  • API-Latenz und Timeout-Fehler: Behoben. Die Performance der Machines API und der GraphQL API ist wieder normal.
  • Eingeschränkte Konnektivität: Durch den vollständigen Rollout der CPU-Kontingente wurden die Maschinen einiger Kunden begrenzt. Dies verursachte Netzwerkprobleme; zur Behebung wurden die Änderungen vorübergehend zurückgenommen.
  • Beeinträchtigte API-Performance: Behoben. Das System wurde skaliert und Korrekturen an der API wurden angewendet; der Betrieb läuft wieder normal.

25. November 2024

  • Beeinträchtigte API-Performance: Das Problem wurde identifiziert und wird behoben. Die Performance der Machines API und des Proxy ist beeinträchtigt.
  • Wiederherstellung des Corrosion-Clusters: Der Wiederherstellungs- und Reseeding-Prozess läuft, auf einigen Hosts wird noch daran gearbeitet.

24. November 2024

  • Keine Vorfälle gemeldet

23. November 2024

  • Keine Vorfälle gemeldet

22. November 2024

  • Logsuche nicht verfügbar: Behoben. Betraf das Fly Metrics-Panel für die Logsuche und frühere App-Logs.

21. November 2024

  • Dringende Netzwerk-Wartung: Abgeschlossen. Der Netzwerkanbieter hat einen Switch ausgetauscht.

20. November 2024

  • Keine Vorfälle gemeldet

19. November 2024

  • Logsuche nicht verfügbar: Behoben. Betraf das Fly Metrics-Panel für die Logsuche und frühere App-Logs.

18. November 2024

  • Keine Vorfälle gemeldet

17. November 2024

  • Keine Vorfälle gemeldet

16. November 2024

  • Keine Vorfälle gemeldet

15. November 2024

  • Keine Vorfälle gemeldet

14. November 2024

  • Beeinträchtigte IPv6-Konnektivität in IAD: Behoben. Das Problem wurde in Zusammenarbeit mit dem Upstream-Anbieter gelöst.

1 Kommentare

 
GN⁺ 2024-11-27
Hacker-News-Kommentare
  • Ein Nutzer erwähnte, dass eine bei fly.io gehostete Website 5 Minuten lang ausgefallen war, danach aber stabil lief. Er verwendet einen kostenlosen Monitoring-Dienst, der alle 5 Minuten prüft.

  • fly.io veröffentlichte ein Postmortem und erklärte, dass 2016 ein zentralisierter TLS-Server namens Consul verwendet wurde, der 2020 durch Corrosion ersetzt wurde. Im Oktober 2024 lief der Root-Key-Signing-Key von Consul ab, wodurch Verbindungen unterbrochen wurden; durch die Bereitstellung neuer SSL-Zertifikate wurde der Dienst wiederhergestellt.

  • Es wurde festgestellt, dass aufgrund von Infrastrukturproblemen bei fly.io auch TLS-Schlüssel anderer Dienste abgelaufen waren, und ein Logging-Tool führte einen DDOS-Angriff gegen den Netzwerkanbieter aus. Die Behebung der verschiedenen Probleme erforderte großen Aufwand.

  • Es wurde die Zuverlässigkeit von fly.io infrage gestellt, mit dem Hinweis, dass es besser sein könnte, einen virtuellen Server zu mieten, wenn eine Cloud-Plattform keine Verlässlichkeit bietet.

  • Die Fly.io-API sei weiterhin nicht erreichbar, und Nutzer könnten weder Deployments noch auf Datenbanken zugreifen. Genaue Updates seien über die Community-Seite verfügbar.

  • Beim persönlichen Vergleich von Fly.io und Railway.com habe Railway besser abgeschnitten und auch der Support sei hervorragend gewesen. Fly.io habe auf Anfragen zur Datenlöschung nicht reagiert.

  • Es wurde berichtet, dass es bereits mehrfach größere Ausfälle bei Fly.io gegeben habe, und betont, dass die Stabilität des Dienstes oberste Priorität haben müsse.

  • Auch Turso habe im Zusammenhang mit dem Ausfall von Fly.io Probleme erlebt, was der CEO auf Discord bestätigt habe.

  • Es wurde die Frage aufgeworfen, wie Fly.io so niedrige Preise anbieten kann; in der technischen Dokumentation werde erklärt, dass Instanzen an einen einzelnen physischen Server gebunden sind und bei einem Serverausfall aus einem Backup wiederhergestellt werden müssen.

  • Es wurde erwähnt, dass Ausfälle gehäuft in Wochen mit wichtigen Feiertagen auftreten und dass auch MS 365/Teams/Exchange betroffen gewesen seien. Vorgeschlagen wurde, an wichtigen Feiertagen keine Änderungen vorzunehmen.

  • Es wurde außerdem erwähnt, dass die Serie von Ausfällen Anfang 2023 ebenfalls mit Problemen rund um Corrosion zusammenhing.