38 Punkte von GN⁺ 2026-02-06 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Mitchell Hashimoto, der nach seinem Exit bei HashiCorp an Ghostty arbeitet, beschreibt den Prozess, wie er AI-Tools in seine tatsächliche Arbeit integriert hat
  • Er unterteilt den Weg in drei Phasen: Ineffizienz → Anpassung → Produktivitätssteigerung, und dokumentiert die Irrtümer und Lernprozesse in jeder Phase konkret
  • Nachdem er die Grenzen des chatbot-basierten Codings erkannt hatte, entdeckte er den eigentlichen Nutzen beim Wechsel zu agentenbasierten Tools
  • Durch das Training, zuvor manuell abgeschlossene Commits mit einem Agenten nachzubilden, erkannte er, dass Aufgabenzerlegung, die Trennung von Planung und Ausführung sowie automatische Verifikation entscheidend sind
  • Indem er die letzten 30 Minuten des Arbeitstags für nächtliche automatisierte Aufgaben nutzt und einfache, wiederholbare Arbeit an Agenten delegiert, erzielt er eine reale Produktivitätssteigerung
  • Derzeit befindet er sich in einer Phase, in der immer ein Agent läuft, kombiniert mit „Harness Engineering“ zur Fehlervermeidung, um die Effizienz der Zusammenarbeit zwischen AI und Mensch zu maximieren

Hintergrund der Einführung und Vorgehensweise

  • Bei der Einführung neuer Tools müsse man immer drei Phasen durchlaufen: Ineffizienz → Anpassung → Innovation
    • Da man an bestehende Workflows gewöhnt ist, ist die anfängliche Einführung unbequem, führt aber langfristig zu höherer Produktivität
  • Statt überzogener Erwartungen oder Kritik an AI-Tools vermittelt er eine ausgewogene Perspektive auf Basis realer Nutzungserfahrungen

Schritt 1: Weg vom Chatbot

  • Coding über Chatbot-Interfaces wie ChatGPT oder Gemini stützt sich auf Vorwissen, und da die Fehlerkorrektur von wiederholtem menschlichem Feedback abhängt, ist es ineffizient
  • Ein Screenshot der Command Palette von Zed, den er in Gemini eingefügt und in SwiftUI nachgebaut bekam, war sein erster „Wow-Moment“ und wurde zur Grundlage der macOS-Command-Palette von Ghostty
  • Im Kontext von Brownfield-Projekten (bestehende Codebasen) erzeugten Chatbots jedoch häufig schlechte Ergebnisse, und das Kopieren und Einfügen von Code und Ausgaben war ineffizienter, als die Arbeit direkt selbst zu erledigen
  • Um echten Nutzen zu erzielen, müsse man unbedingt Agenten einsetzen; Agenten sind Tools, bei denen ein LLM wiederholt externe Aktionen aufrufen kann und dafür mindestens Dateien lesen, Programme ausführen und HTTP-Anfragen stellen können muss

Schritt 2: Die eigene Arbeit mit einem Agenten nachbilden

  • Als er Claude Code zum ersten Mal nutzte, war er mit den Ergebnissen unzufrieden, und die Nacharbeit dauerte länger, als es selbst zu tun
  • Statt aufzugeben, wiederholte er ein Training, bei dem er manuelle Commits mit einem Agenten identisch reproduzieren ließ
    • Es war ein schmerzhafter Prozess, dieselbe Arbeit zweimal zu machen (manuell + Agent), aber Reibung bei der Einführung neuer Werkzeuge ist natürlich
  • Dabei entdeckte er drei zentrale Prinzipien:
    • Sitzungen in klare, ausführbare Teilaufgaben zerlegen
    • Bei unklaren Anforderungen Planungssitzung und Ausführungssitzung trennen
    • Dem Agenten Möglichkeiten zur Verifikation der Arbeit geben, damit er Fehler selbst korrigieren und Regressionen vermeiden kann
  • Auch zu wissen, wann man Agenten nicht einsetzen sollte, indem man ihre Schwächen versteht, war ein großer Effizienzgewinn
  • In dieser Phase spürte er zwar noch keine Netto-Effizienzsteigerung, akzeptierte den Agenten aber zufrieden als Werkzeug

Schritt 3: Agenten zum Tagesabschluss einsetzen

  • Er führte ein Muster ein, jeden Tag die letzten 30 Minuten für das Starten von Agentenarbeit zu reservieren
    • Die Hypothese: Wenn Agenten außerhalb der eigenen Arbeitszeit Fortschritt machen, entsteht Effizienzgewinn
  • Drei Arten von Aufgaben erwiesen sich als effektiv:
    • Deep-Research-Sessions: Untersuchung einer bestimmten lizenzierten Bibliothek in einer bestimmten Sprache, mit Zusammenfassungen über Vor- und Nachteile, Entwicklungsaktivität und Reaktionen der Community über mehrere Seiten hinweg
    • Erkundung vager Ideen mit parallelen Agenten: nicht für einen Release, sondern um für die Arbeit am nächsten Tag unbekannte Variablen aufzudecken
    • Klassifizierung und Review von Issues und PRs: mit gh (GitHub CLI) führt er Issue-Triage durch parallele Agenten aus; die Agenten antworten nicht direkt, sondern erzeugen nur einen Bericht zur Durchsicht am nächsten Tag
  • Er ließ Agenten nicht die ganze Nacht in Schleifen laufen; die meisten Aufgaben waren innerhalb von 30 Minuten abgeschlossen
  • Indem er die ermüdende Zeit am Ende des Tages in Agentenarbeit umwandelte, sicherte er sich am nächsten Morgen einen „Warm-Start“-Effekt

Schritt 4: Verlässliche Delegation von Aufgaben

  • Nachdem er Aufgaben identifiziert hatte, die Agenten mit hoher Wahrscheinlichkeit gut erledigen, delegiert er diese an Background-Agenten und konzentriert sich selbst auf andere Arbeit
  • Jeden Morgen filtert er die Triage-Ergebnisse der vorherigen Nacht manuell und wählt Issues aus, die sich für Agenten eignen, die dann jeweils einzeln ausgeführt werden
  • In dieser Zeit arbeitet er selbst direkt an tiefem Denken auf die frühere, nicht-AI-gestützte Weise, statt in sozialen Medien oder Videos zu versinken
  • Entscheidend ist es, Desktop-Benachrichtigungen des Agenten auszuschalten: Da Context Switching teuer ist, ist es effizienter, wenn nicht der Agent den Menschen unterbricht, sondern dieser bei natürlichen Pausen nachsieht
  • Als Reaktion auf Anthropics Forschungspaper zur Skill-Bildung: Auf Skill-Bildung bei an Agenten delegierten Aufgaben verzichtet er, aber bei Arbeiten, die er weiterhin manuell erledigt, setzt sich Skill-Bildung natürlich fort
  • In dieser Phase erreichte er ein Niveau, „von dem es kein Zurück mehr gibt“; der größte Vorteil ist, dass er sich auf die Arbeit konzentrieren kann, die ihm Spaß macht

Schritt 5: Harness Engineering

  • Am effizientesten sind Agenten dann, wenn sie beim ersten Versuch das richtige Ergebnis liefern oder nur minimale Korrekturen benötigen
  • Jedes Mal, wenn ein Agent einen Fehler macht, eine Lösung so zu konstruieren, dass derselbe Fehler nie wieder passiert, ist das Konzept des „Harness Engineering“
  • Es gibt zwei Formen:
    • Implizite Verbesserungen des Promptings (AGENTS.md): Wenn ein Agent falsche Befehle ausführt oder die falsche API findet, wird das in der Datei AGENTS.md festgehalten, um das Problem zu lösen — im Ghostty-Repository gibt es reale Beispiele
    • Programmgesteuerte Tools: Skripte für Screenshot-Erfassung, gefilterte Testläufe usw. schreiben und in AGENTS.md auf die Existenz dieser Tools hinweisen
  • Er befindet sich derzeit in dieser Phase und investiert aktiv in die Vermeidung schlechten Agentenverhaltens sowie in die Verifikation guten Verhaltens

Schritt 6: Immer einen Agenten laufen lassen

  • Parallel zu Schritt 5 setzt er sich das Ziel, immer einen Agenten im Hintergrund laufen zu haben
  • Er bevorzugt langsame Modelle, die wie der deep mode von Amp (auf Basis von GPT-5.2-Codex) länger als 30 Minuten brauchen, aber hochwertige Ergebnisse liefern
  • Derzeit lässt er nicht mehrere Agenten parallel laufen und hält die Balance zwischen einem Agenten und manueller Arbeit für passend
  • Tatsächlich läuft nur während etwa 10–20 % der Arbeitszeit ein Background-Agent, und er arbeitet daran, diesen Anteil zu erhöhen
  • Das Ausführen eines Agenten ist nicht das Ziel an sich; er sollte nur dann laufen, wenn es wirklich hilfreiche Aufgaben gibt, und hochwertige delegierbare Workflows zu schaffen, ist auch unabhängig von AI wichtig

Aktueller Stand und Perspektive

  • Er erzielt mit AI-Tools Ergebnisse und verfolgt dabei einen realitätsbasierten, ausgewogenen Blick
  • Er arbeitet nicht für ein AI-Unternehmen, investiert nicht in eines und berät keines; unabhängig davon, ob AI bleibt oder verschwindet, ist seine Kernmotivation die Freude am Bauen als Software-Handwerker
  • Hinsichtlich der Skill-Bildungsprobleme bei Junior-Entwicklern mit schwachen Grundlagen ist er tief besorgt
  • Da sich Modelle sehr schnell weiterentwickeln, müsse die Einschätzung dessen, was Agenten nicht können, fortlaufend neu überprüft werden
  • Ob man AI nutzt oder nicht, ist eine persönliche Entscheidung; dieser Text dient dem persönlichen Teilen eines Beispiels dafür, wie man Werkzeuge erkundet und einsetzt

Noch keine Kommentare.

Noch keine Kommentare.