1 Punkte von p2c2kbf 2026-04-13 | Noch keine Kommentare. | Auf WhatsApp teilen

AIWatch ist ein Open-Source-Projekt, das Ausfälle, Uptime und Wiederherstellungszeiten wichtiger AI-Services wie Claude, OpenAI und Gemini in Echtzeit überwacht.

Dashboard: https://ai-watch.dev
Landingpage: https://ai-watch.dev/intro
GitHub: https://github.com/bentleypark/aiwatch

Bei einem Ausfall analysiert die AI die Ursache, prognostiziert die Wiederherstellungszeit und sendet sofort Benachrichtigungen an Discord/Slack.

Heute veröffentlichen wir auf Basis der in den 12 Tagen vom 20. bis 31. März gesammelten Daten den Zuverlässigkeitsbericht für 27 Services (Stand März). Da es der erste Bericht ist, ist der Zeitraum kurz; ab April wird er mit den vollständigen Monatsdaten veröffentlicht.

Drei zentrale Erkenntnisse

1. Uptime-%-Werte sind unvollständig
Die Claude API verzeichnete 99 % Uptime, dennoch gab es in 12 Tagen 9 Incidents.
Cohere erreichte 100 % Uptime und null Incidents.
Anhand der Zahlen allein wirken sie ähnlich, tatsächlich ist die Zuverlässigkeit jedoch völlig unterschiedlich.

2. Viele kurze Incidents summieren sich zu einem großen Problem
Together AI hatte mit 20 Incidents in 12 Tagen die meisten,
die durchschnittliche Wiederherstellungszeit lag jedoch bei 25 Minuten, womit die gesamte Downtime 8 Stunden 37 Minuten betrug.
ChatGPT hatte dagegen nur 4 Incidents, aber einer davon dauerte 19 Stunden 46 Minuten.

3. Risiko durch Upstream-Abhängigkeiten
Der 74-stündige Ausfall des Voice Agent von Deepgram begann mit einem Ausfall bei OpenAI.
Services, die AI auf andere AI aufsetzen, übernehmen Ausfälle der übergeordneten Services unverändert.


Top 5 im AIWatch Score (Stand März)

Service Score Stufe Incidents
Cohere API 100 Excellent 0
Hugging Face 100 Excellent 0
OpenRouter 99 Excellent 0
Groq Cloud 93 Excellent 1
DeepSeek API 92 Excellent 1
OpenAI API 88 Excellent 1 (2h 56m)
Together AI 84 Good 20 (Ø 25m)
ChatGPT 73 Good 4 (max. 19h 46m)
Claude API 59 Fair 9 (nach Modell getrennt erfasst)
ElevenLabs 47 Degrading 2 (max. 4h 47m)

Formel für den Score (laut März-Bericht): Uptime(50) + Incident-Auswirkungstage(30) + Wiederherstellungszeit(20) = maximal 100 Punkte
Da nicht die Anzahl der Incidents, sondern die Auswirkungstage (affected_days) zugrunde gelegt werden, ist ein fairer Vergleich unabhängig von der Art des Reportings möglich.
Vollständige Offenlegung der Berechnung: https://ai-watch.dev/#about-score

ElevenLabs erhielt mit einer Uptime von 97,55 % als einziger der 27 Services die Stufe Degrading.
Wenn ihr Sprach-/Audio-Services in der Produktion einsetzt, ist Vorsicht geboten.


Hinweise

  • Der Überwachungszeitraum vom 20. bis 31. März (12 Tage) ist als erster Bericht nur teilweise aussagekräftig.
    Ab April wird er mit vollständigen Monatsdaten veröffentlicht.

Empfehlungen nach Einsatzzweck (laut März-Bericht)

  • Produktionskritisch: Cohere (100 Punkte, 0 Incidents), OpenAI API (88 Punkte, 1 Incident / gesamte Downtime 2h 56m)
  • Niedrige Latenz / Stabilität: Groq Cloud (93 Punkte, 100 % Uptime), DeepSeek API (92 Punkte)
  • Coding-Workflows: Cursor, Windsurf (hohe Uptime)
  • Sprache/Audio: AssemblyAI empfohlen + Fallback zwingend erforderlich (mehrere Ausfälle bei ElevenLabs·Deepgram)

Noch keine Kommentare.

Noch keine Kommentare.