3 Punkte von solvewithit 2026-03-29 | Noch keine Kommentare. | Auf WhatsApp teilen

Ich denke, für viele Menschen sind Agenten noch immer etwas eher Vages. Irgendwie wirken sie beeindruckend, aber wenn man sie tatsächlich öffnet, bekommt man oft kein gutes Gefühl dafür, wie sie intern funktionieren oder wo man überhaupt anfangen sollte, daran herumzuschrauben.

Mir ging es ähnlich. Dann hörte ich, dass der Kern von OpenClaw pi-mono ist, und ich fand beeindruckend, dass es sich dabei um einen sehr minimalistischen Agenten handelt. Für mich war das besonders ein gutes Beispiel für die Philosophie: „Das Mächtigste ist ein einfaches System.“ Deshalb habe ich beschlossen, das als Ausgangspunkt für meinen eigenen Agenten zu nehmen und ihn testweise nach Python zu übertragen – zunächst nur so weit, dass er automatisch Code schreiben kann.

Tatsächlich gibt es im aktuellen py-pimono noch viel mehr Dinge, die in pi-mono bereits vorhanden sind, aber noch nicht übernommen wurden. Zum Beispiel diese hier:

  • Sitzungsverwaltung
  • Steering
  • Follow-up
  • verschiedene Utilities
  • Streaming

Dadurch ist py-pimono weniger ein fertiges Produkt als vielmehr ein Agent, bei dem wirklich fast nichts vorhanden ist, der aber immerhin läuft – also eher ein nahezu reines Skelett. Stattdessen ist die Struktur vergleichsweise klar offengelegt, damit man leicht ein Gefühl dafür bekommt, wo man hineinschauen und wo man was anfügen kann. Deshalb dachte ich, dass es auch für Menschen, denen Agenten noch abstrakt erscheinen, gut geeignet sein könnte, die Struktur nachzuvollziehen und selbst Hand anzulegen. Ich wollte es so gestalten, dass man Fragen wie die folgenden in einer möglichst kleinen Codebasis nachvollziehen kann.

  • Manche wollen wissen, wie sich „ein Agent läuft kontinuierlich über längere Zeit“ im Code ausdrückt
  • Andere wollen wissen, wie Sitzungsdaten gespeichert und wieder geladen werden

Deshalb habe ich das Repository so aufgebaut, dass solche Dinge möglichst voneinander getrennt sind. Ich hoffe, es kann ein guter Ausgangspunkt sein, um den Code gemeinsam mit einem LLM zu lesen und zu analysieren, eigene Loops oder eine eigene Sitzungsverwaltung anzubauen und die Struktur Schritt für Schritt zu erweitern.

Damit man es aber sofort ausführen und praktisch kennenlernen kann, habe ich auf dieses minimale Harness gleich auch eine UI gesetzt. Wenn ihr das Verzeichnis ui/ öffnet, findet ihr dort außerdem verschiedene UIs, mit denen ich experimentiert habe, sowie eine Discord-Anbindung.

Installation:

pip install py-pimono  

Wenn Codex bereits authentifiziert ist, könnt ihr es direkt starten.

pyai  

Auch ohne Codex-Authentifizierung läuft als Fallback der papageienartige MockLlm, daher macht es durchaus Spaß, Breakpoints zu setzen und sich den Agent-Loop beim Laufen anzusehen.

Wenn Codex noch nicht authentifiziert ist, meldet euch zuerst an und startet es dann.

codex login  
pyai  

Danach fände ich es spannend, gemeinsam mit euch genau die wirklich wichtigen, aber bisher noch fehlenden Dinge so sauber und minimalistisch wie möglich anzubauen. Statt Agenten als etwas Vages stehen zu lassen, wollte ich das teilen, damit mehr Menschen das Gefühl bekommen, sie selbst zu öffnen, zu verändern und zu etwas Eigenem zu machen.

Noch keine Kommentare.

Noch keine Kommentare.