Claude API mit 99 % Uptime und 9 Incidents — Zuverlässigkeitsbericht für AI-Services im März veröffentlicht
(reports.ai-watch.dev)AIWatch ist ein Open-Source-Projekt, das Ausfälle, Uptime und Wiederherstellungszeiten wichtiger AI-Services wie Claude, OpenAI und Gemini in Echtzeit überwacht.
Dashboard: https://ai-watch.dev
Landingpage: https://ai-watch.dev/intro
GitHub: https://github.com/bentleypark/aiwatch
Bei einem Ausfall analysiert die AI die Ursache, prognostiziert die Wiederherstellungszeit und sendet sofort Benachrichtigungen an Discord/Slack.
Heute veröffentlichen wir auf Basis der in den 12 Tagen vom 20. bis 31. März gesammelten Daten den Zuverlässigkeitsbericht für 27 Services (Stand März). Da es der erste Bericht ist, ist der Zeitraum kurz; ab April wird er mit den vollständigen Monatsdaten veröffentlicht.
Drei zentrale Erkenntnisse
1. Uptime-%-Werte sind unvollständig
Die Claude API verzeichnete 99 % Uptime, dennoch gab es in 12 Tagen 9 Incidents.
Cohere erreichte 100 % Uptime und null Incidents.
Anhand der Zahlen allein wirken sie ähnlich, tatsächlich ist die Zuverlässigkeit jedoch völlig unterschiedlich.
2. Viele kurze Incidents summieren sich zu einem großen Problem
Together AI hatte mit 20 Incidents in 12 Tagen die meisten,
die durchschnittliche Wiederherstellungszeit lag jedoch bei 25 Minuten, womit die gesamte Downtime 8 Stunden 37 Minuten betrug.
ChatGPT hatte dagegen nur 4 Incidents, aber einer davon dauerte 19 Stunden 46 Minuten.
3. Risiko durch Upstream-Abhängigkeiten
Der 74-stündige Ausfall des Voice Agent von Deepgram begann mit einem Ausfall bei OpenAI.
Services, die AI auf andere AI aufsetzen, übernehmen Ausfälle der übergeordneten Services unverändert.
Top 5 im AIWatch Score (Stand März)
| Service | Score | Stufe | Incidents |
|---|---|---|---|
| Cohere API | 100 | Excellent | 0 |
| Hugging Face | 100 | Excellent | 0 |
| OpenRouter | 99 | Excellent | 0 |
| Groq Cloud | 93 | Excellent | 1 |
| DeepSeek API | 92 | Excellent | 1 |
| OpenAI API | 88 | Excellent | 1 (2h 56m) |
| Together AI | 84 | Good | 20 (Ø 25m) |
| ChatGPT | 73 | Good | 4 (max. 19h 46m) |
| Claude API | 59 | Fair | 9 (nach Modell getrennt erfasst) |
| ElevenLabs | 47 | Degrading | 2 (max. 4h 47m) |
Formel für den Score (laut März-Bericht): Uptime(50) + Incident-Auswirkungstage(30) + Wiederherstellungszeit(20) = maximal 100 Punkte
Da nicht die Anzahl der Incidents, sondern die Auswirkungstage (affected_days) zugrunde gelegt werden, ist ein fairer Vergleich unabhängig von der Art des Reportings möglich.
Vollständige Offenlegung der Berechnung: https://ai-watch.dev/#about-score
ElevenLabs erhielt mit einer Uptime von 97,55 % als einziger der 27 Services die Stufe Degrading.
Wenn ihr Sprach-/Audio-Services in der Produktion einsetzt, ist Vorsicht geboten.
Hinweise
- Der Überwachungszeitraum vom 20. bis 31. März (12 Tage) ist als erster Bericht nur teilweise aussagekräftig.
Ab April wird er mit vollständigen Monatsdaten veröffentlicht.
Empfehlungen nach Einsatzzweck (laut März-Bericht)
- Produktionskritisch: Cohere (100 Punkte, 0 Incidents), OpenAI API (88 Punkte, 1 Incident / gesamte Downtime 2h 56m)
- Niedrige Latenz / Stabilität: Groq Cloud (93 Punkte, 100 % Uptime), DeepSeek API (92 Punkte)
- Coding-Workflows: Cursor, Windsurf (hohe Uptime)
- Sprache/Audio: AssemblyAI empfohlen + Fallback zwingend erforderlich (mehrere Ausfälle bei ElevenLabs·Deepgram)
Noch keine Kommentare.