Claude-Code-Nutzungsmonitor – Echtzeit-Tracker zur Umgehung von Nutzungslimits

(github.com/Maciek-roboblog)

12 Punkte von GN⁺ 2025-06-21 | 2 Kommentare | Auf WhatsApp teilen

Ein Monitoring-Tool, das verschiedene Informationen wie Claude-AI-Token-Nutzung, Verbrauchsgeschwindigkeit und Verbrauchsprognosen in Echtzeit im Terminal anzeigt
Alle 3 Sekunden aktualisierte farbige Fortschrittsbalken und intelligente Vorhersage des Token-Verbrauchs
Wenn das Standard-Planlimit überschritten wird, analysiert es Sitzungsprotokolle und wechselt sofort auf das tatsächliche Limit
Erkennt und unterstützt automatisch Nutzungspläne wie Pro/Max5/Max20/custom_max
Echtzeitwarnungen bei bevorstehendem oder überschrittenem Token-Limit pro Sitzung sowie bei Verbrauchsrisiko vor dem Sitzungs-Reset
Eine auf den tatsächlichen Claude-Nutzungsablauf optimierte Oberfläche
Installation per npm, pip, empfohlen wird die Nutzung einer virtuellen Umgebung (venv/virtualenv), Unterstützung für Mac/Linux/Windows

Claude-Sitzungen verstehen

5-Stunden-Rolling-Window
- Eine Sitzung bleibt ab dem Zeitpunkt der ersten gesendeten Nachricht 5 Stunden aktiv
- Limits gelten pro Sitzung, mehrere Sitzungen können gleichzeitig aktiv sein
- Der tatsächliche Reset erfolgt ausgehend von meinen Nachrichten alle 5 Stunden
Der Zeitpunkt für Sitzungs-/Token-Resets kann passend zum eigenen Zeitplan festgelegt werden

Einsatzszenarien

Entwickler am Morgen/bei Arbeitsbeginn: Der Token-Reset-Zeitplan kann an den Arbeitsbeginn (z. B. 9 Uhr) angepasst werden, um effizienter zu planen
Nachtarbeiter: Nutzung von Token-Resets passend zum eigenen Zeitplan, etwa um Mitternacht
Nutzer mit variablem Limit: Im custom_max-Modus wird das passende Limit automatisch anhand der tatsächlichen Umgebung erkannt
Globale/Remote-Entwickler: Wechsel zwischen mehreren Zeitzonen, teamweite Festlegung von Reset-Zeiten → optimierte Zusammenarbeit
Schneller Statuscheck: Einfach ausführen (unabhängig von der Konfiguration)

Best Practices für die Einrichtung

Monitoring direkt beim Sitzungsstart beginnen
- Den Monitor sofort starten, wenn die Arbeit mit Claude beginnt (./ccusage_monitor.py)
- Unterstützte Pläne
  - pro: ca. 7.000 Tokens (Tests und leichtgewichtige Nutzung)
  - max5: ca. 35.000 Tokens (alltägliche Entwicklung)
  - max20: ca. 140.000 Tokens (große Projekte und mittlere/hohe Intensität)
  - custom_max: Automatischer Erkennungsmodus (verwendet den Maximalwert auf Basis des tatsächlichen Nutzungsverlaufs)
- Verbesserte Genauigkeit beim Tracking der Tokens über die gesamte Sitzung
- Berechnung der Token-Verbrauchsgeschwindigkeit und frühzeitige Warnung bei Annäherung an das Limit
Python-Virtual-Environment (venv) verwenden
- Verhindert Abhängigkeitskonflikte, trennt Umgebungen und sichert Reproduzierbarkeit pro Projekt
- Installation und Ausführung:
```
python3 -m venv venv  
source venv/bin/activate  
pip install pytz  
```
- Zum Entfernen genügt es, den Ordner der virtuellen Umgebung zu löschen
Benutzerdefinierten Shell-Alias anlegen
- Wiederkehrende Befehle lassen sich auf eine Zeile verkürzen
```
alias claude-monitor='cd ~/Claude-Code-Usage-Monitor && source venv/bin/activate && ./ccusage_monitor.py'  
```
- Zu .bashrc oder .zshrc hinzufügen, damit sich der Monitor mit einer Eingabe direkt starten lässt

Best Practices für die Nutzung

Burn Rate (Verbrauchsgeschwindigkeit) kontinuierlich überwachen
- Vorsicht, wenn der Token-Verbrauch plötzlich stark ansteigt
- Arbeitsintensität je nach verbleibender Zeit und verbleibenden Tokens anpassen
- Größere Aufgaben wie umfangreiche Refactorings zeitlich vor oder nach dem Sitzungs-Reset (Token-Initialisierung) planen
Strategische Sitzungsplanung
- Große Aufgaben direkt nach einem Token-Reset beginnen, bei Annäherung an das Limit eher leichte Aufgaben erledigen
```
./ccusage_monitor.py --reset-hour 9  
```
- Mithilfe der 5-Stunden-Regel pro Sitzung lassen sich mehrere überlappende Sitzungen parallel betreiben
Zeitzone eindeutig festlegen
- Für präzise Vorhersagen zum Token-Reset und eine verlässliche Zeitplanung die tatsächliche Arbeits-/Zusammenarbeitszeitzone berücksichtigen
```
./ccusage_monitor.py --timezone Asia/Seoul  
```
- Verhindert Zeitabweichungen bei der Zusammenarbeit mit mehreren Ländern/Teams und minimiert Verwirrung über Sitzungsabläufe

Optimierungstipps

Terminal-Umgebung einrichten
- Ein Terminal mit mindestens 80 Zeichen Breite wird empfohlen
- Farbunterstützung maximiert das visuelle Feedback
- Ein separates Fenster für dauerhaftes Monitoring wird empfohlen
In den Workflow integrieren
- Mit Terminal-Multiplexern wie tmux kann parallel zur Entwicklung überwacht werden
```
tmux new-session -d -s claude-monitor './ccusage_monitor.py'  
tmux attach -t claude-monitor  
```
Multi-Session-Strategie
- Pro Sitzung gelten feste 5 Stunden, überlappende Sitzungen können gleichzeitig verwaltet werden
- Lange Arbeiten auf mehrere Sitzungen verteilen und dabei Limit/Ablauf jeder Sitzung im Blick behalten

Beispiel für einen realen Workflow

Entwicklung eines großen Projekts
```
./ccusage_monitor.py --plan max20 --reset-hour 8 --timezone America/New_York  
```
- Token-Reset um 8 Uhr → Start der Entwicklung zentraler Funktionen
- Um 10 Uhr Burn Rate prüfen und Arbeitstempo anpassen
- Um 12 Uhr den Nachmittagsplan prüfen und abstimmen
- Um 14 Uhr eine neue Sitzung öffnen und komplexe Probleme bearbeiten
- Um 16 Uhr leichte Aufgaben / Vorbereitung der Abendsitzung
Nutzung mit Fokus auf Lernen/Experimente
```
./ccusage_monitor.py --plan pro  
```
- Geeignet für leichtes Lernen und experimentelles Coden
Fokussierte Sprint-Entwicklung
```
./ccusage_monitor.py --plan max20 --reset-hour 6  
```
- Maßgeschneiderte Konfiguration für Entwicklung mit erwarteter intensiver Token-Nutzung

2 Kommentare

fanotify 2025-06-21

Das ist dasselbe: https://de.news.hada.io/topic?id=21560

GN⁺ 2025-06-21

Hacker-News-Kommentar

Ich teile die Meinung, dass mich die mangelnde Transparenz von Claude frustriert, und finde diese Idee wirklich gut. Die Kernstärke von Claude Code ist, dass es Kontext und Limits besser handhaben kann als die Desktop-App, etwa mit dem Compact-Modus oder der Anzeige des verbleibenden Anteils in %, aber es fühlt sich noch nicht ausreichend an. Als zusätzlicher Hinweis: Im README eines Projekts zu viele Emojis zu verwenden, wirkt auf mich persönlich ziemlich unprofessionell, und es weckt bei mir die Sorge, dass es sich um ein Projekt handelt, das von einer AI nur nach „Vibe“ zusammenkodiert wurde, ohne ordentliches Management.
- Als ich in die Softwarebranche eingestiegen bin, war die Stimmung noch so, dass man einen fast in die Psychiatrie geschickt hätte, wenn man mit Emojis in einer Codebase erwischt worden wäre. Inzwischen haben sich die Zeiten stark geändert, und ich nutze Emojis oft, um visuell Kontext zu strukturieren. Mittlerweile steckt mein Code voller Emojis, genug, um mich glücklich zu machen.
- Diesen Emoji-Stil sieht man heute oft bei Startups oder jüngeren Firmen. Wahrscheinlich ist der Einfluss von Notion groß. In unserer Firma ist es sogar so, dass wir immer Emojis auswählen, selbst wenn wir nur eine Liste, eine Seite oder eine Kalender-Einladung erstellen.
- Ich finde es ziemlich ironisch, dass so ein Kommentar ausgerechnet bei Software auftaucht, die für AI-Coding gemacht wurde.
- Wenn man sich den Code tatsächlich anschaut, ist es im Grunde nur eine 400-Zeilen-Python-Datei, die einfach ccusage umhüllt. Deshalb kann ich nachvollziehen, warum es so wirkt.
- Bei PR-Beschreibungen oder READMEs, die von AI erzeugt werden, füge ich dem Prompt immer die Bedingung hinzu: „knapp, ohne übertriebene Ausschmückungen oder Emojis“. Dadurch wird aus der ablenkenden Emoji-Party ein angemessenes Dokument. Je nach Situation kann das natürlich variieren.
Ich bin der Autor von ccusage und freue mich, dass die Leute unser Open-Source-Projekt auf so viele verschiedene Arten nutzen. Happy vibe coding!
- Lustigerweise hat Show HN zu ccusage keinen einzigen Kommentar, während dieser Thread sehr lebhaft ist. Link zum verwandten Thread
Zur Einordnung: Mein historisches Maximum beim Token-Limit pro Session lag bei etwa 337.492, und ich nutze den Max20-Plan sowie Opus zu ungefähr 99 %. Ich verwende Claude Code seit dem 27. Mai, insgesamt habe ich 1.374.439.311 Tokens verbraucht, was etwa 3.397 Dollar entspricht.
- Ich habe mit dem Max20-Plan etwa 2.100 Dollar an Nutzung herausgeholt. Ich frage mich, ob bei der API enorme Margen übrig bleiben oder ob sie dabei Verlust machen. Ich nutze es täglich, aber ich habe nicht das Gefühl, es exzessiv zu verwenden.
- Mich würde interessieren, ob du bei Opus oft ins Rate-Limit läufst und ob es sich im Vergleich zu Sonnet langsamer anfühlt.
Ich kann inzwischen intuitiv einschätzen, wie nah ich mit meiner bisherigen Token-Nutzung am Limit bin. Ich merke auch, wann ein Gespräch selbst kurz davor steht, sein Maximum zu erreichen; dann lasse ich mit den letzten verbleibenden Ressourcen eine Zusammenfassung erzeugen und mache in einem neuen Gespräch weiter. Es fühlt sich an, als wären diese AI-Tools inzwischen Teil meiner inneren Uhr geworden. Da das wöchentliche Limit von ChatGPT jeden Mittwoch zurückgesetzt wird, fühlt sich Mittwoch wie ein neuer Sonntag an.
Ich habe beobachtet, dass die Nutzung nicht zurückgesetzt wird, wenn sie nach Ablauf des Zeitfensters nicht 100 % erreicht. Wenn man zum Beispiel 90 % verbraucht, dann ins nächste Fenster rutscht und die verbleibenden 10 % schnell aufbraucht, muss man unter Umständen sehr lange warten.
Ich habe ein UI-Tool gebaut, mit dem man mehrere Claude-Code-Sessions gleichzeitig nutzen kann: crystal. Da ich oft an mehreren Funktionen gleichzeitig arbeite, stoße ich häufig an die Grenzen meines Accounts. Meistens erreiche ich das Limit in der Nähe des Reset-Zeitpunkts, aber es wäre noch besser, wenn ich vorher wüsste, wann ich eine Pause einlegen sollte.
- Ich nutze Claude Code extrem viel, aber ich traue mir nicht zu, selbst Tooling für Worktrees und mehrere Sessions zu bauen, weil mein Git-Verständnis dafür zu schwach ist. Ehrlich gesagt habe ich sogar ein wenig Angst davor, dieses Tool zu verwenden; idealerweise würde ich jeden Worktree in einem Container laufen lassen, aber es scheint schwierig zu sein, das so flüssig hinzubekommen wie Crystal.
- Ich mag das Tool, aber Crystal ist schon der Name einer Programmiersprache, die ich früher benutzt habe, daher ist es etwas verwirrend.
- Wenn du auf GitHub ein Issue hinterlässt (hier), kann ich auch versuchen, eine Integration mit meinem Usage-Monitor zu bauen.
- Großartig. Ich hätte Laude fast gebeten, auch so ein Tool zu bauen, nicht nur pro Projekt, sondern für fünf parallele Projekte. Ich sehe da viele Einsatzmöglichkeiten.
Wirklich interessant, aber ich frage mich, ob das Token-Limit im Pro-Plan tatsächlich nur 7.000 beträgt. Das wäre ja nicht einmal 7.000 Wörter, und in der Praxis fühlt es sich so an, als könne man deutlich mehr nutzen. Dann müsste man doch schon bei etwas längeren Gesprächen sehr schnell an Grenzen stoßen, aber ich habe das bisher noch nie erlebt. Vielleicht gilt dieses Limit nur für Claude Code; ich habe Claude Code noch nicht so viel genutzt und weiß es daher nicht genau.
- Der Pro-Plan kostet 20 $ im Monat. Vor Kurzem wurde der Zugang zu claude code freigeschaltet. Allerdings habe ich gehört, dass manche Nutzer schon nach wenigen Queries ins Limit laufen. Daher denke ich, dass diese Größenordnung plausibel ist. Die Limits im Chat-Interface und die Limits von Claude Code sind getrennt.
Wirklich hervorragend, danke fürs Bauen. Ich frage mich, ob man es mit uv installieren kann. Zusammen mit einem Link zu uv wurden Shell-Befehle geteilt, die den Installationsprozess Zeile für Zeile zeigen.
- Wenn das Repo als Paketstruktur mit project.toml o. Ä. aufgebaut wäre, könnte man es mit pipx(pipx) noch schneller so installieren:

pipx install git+https://github.com/Maciek-roboblog/Claude-Code-Usage-Monitor ccusage_monitor Bei uv gibt es vermutlich einen ähnlichen Befehl, uvx, aber ich bin nicht sicher, ob Funktion und Zweck wirklich dieselben sind wie bei pipx.

Zur Info: Fast alles, was sich mit pip installieren lässt, kann man auch mit uv installieren, also geht es mit uv ebenfalls einfacher.
Gibt es an diesem Tool außer der Ausführung von ccusage per Shell noch etwas anderes Nützliches? Ehrlich gesagt bin ich von Projekten dieser Art etwas enttäuscht, weil es sich anfühlt, als wäre das in einem Durchgang mit einem AI-Tool zusammengeschustert worden. Bei Show HN wird nicht einmal erwähnt, dass die gesamte eigentliche Arbeit von einem anderen Tool erledigt wird, was ich schade finde.
Ich hatte gestern eine merkwürdige Erfahrung mit Claude Code. Ich habe versucht, eine alte phtml-Tabellenseite in PHP in ein neues div-Layout umzubauen, bin gescheitert und habe dabei etwa 4 Dollar verbrannt. Vielleicht lag es an einem WSL-Problem, aber ich hoffe, dass so etwas nicht oft passiert.
- Claude Code hat eine ziemlich steile Lernkurve. Man muss lange Gesprächssitzungen führen, die Anforderungen ausreichend diskutieren und das Modell zu klaren Fragen anleiten. Trotzdem kann es gelegentlich zu solchen Fehlschlägen kommen, deshalb sollte man im Kopf behalten, dass es ein sehr teures Tool ist. Es ist nicht die Magie, als die es von YouTubern oder Bloggern dargestellt wird.

Claude-Code-Nutzungsmonitor – Echtzeit-Tracker zur Umgehung von Nutzungslimits

Claude-Sitzungen verstehen

Einsatzszenarien

Best Practices für die Einrichtung

Best Practices für die Nutzung

Optimierungstipps

Beispiel für einen realen Workflow

Verwandte Beiträge

2 Kommentare

Hacker-News-Kommentar