Eine Person + ein Agent = einen 20K-Code-Browser von Grund auf bauen

(emsh.cat)

7 Punkte von GN⁺ 2026-01-29 | Noch keine Kommentare. | Auf WhatsApp teilen

Ein Browser, der HTML und CSS rendern kann, wurde in nur 3 Tagen von einer Person und einem LLM-Agenten direkt in Rust implementiert
Das Projekt wurde mit rund 20.150 Zeilen Code fertiggestellt und enthält grundlegende Funktionen wie Scrollen, Zurück-Navigation und Headless-Modus
Es wurde so konzipiert, dass es ohne externe Rust-Bibliotheken unter Windows, macOS und Linux läuft
Der Entwicklungsprozess erfolgte in Zusammenarbeit mit dem Codex-Agenten: Der Mensch übernahm Koordination und Verifikation, der Agent das Schreiben des Codes
Das Ergebnis zeigt, dass die Kombination „eine Person + ein Agent“ effizienter ist als eine Vielzahl von Agenten

Projektüberblick

Das Ziel war, einen grundlegenden Browser, der HTML und CSS rendern kann, vollständig von Grund auf neu zu bauen
- JavaScript wird nicht unterstützt
- Der Entwickler begann „zum Spaß“ und setzte das Projekt in Zusammenarbeit mit dem LLM-Agenten (Codex) um
Es wurden Rahmenbedingungen wie Fertigstellung innerhalb von 3 Tagen, Verbot externer Rust-Abhängigkeiten und Unterstützung für die drei großen Betriebssysteme gesetzt
Der Browser verfügt über eine eigene Rendering-Engine und enthält Screenshot-Funktion, Link-Klicks und Regressionstests

Gestartet wurde mit dem Rendern von „Hello World“, danach kamen die Verarbeitung verschachtelter Tags und eine Screenshot-Funktion hinzu
Die HTML/CSS-Spezifikation wurde definiert, und für E2E-Tests wurde eine Bildvergleichsfunktion eingeführt
Schon nach einem Tag war der Stand erreicht, Websites per X11 und cURL abzurufen und zu rendern
- Die Codebasis umfasste etwa 7.500 Zeilen, alle Dateien blieben unter 1.000 Zeilen

Um das Problem sich während der Tests öffnender Fenster zu lösen, wurde ein --headless-Modus hinzugefügt
Fenstergrößenanpassung, Kompatibilität, Performance und Schrift-Rendering wurden verbessert
Der Workflow bestand darin, Screenshots von Websites zu teilen und Codex diese nachbilden zu lassen
- Den Großteil des Codes schrieb der Agent, der Mensch war für Prüfung und Freigabe zuständig

Wesentliche Browserfunktionen wie Scrollen, Debug-Logs und Zurück-Button wurden ergänzt
Unterstützung für macOS und Windows wurde implementiert und die Tests bestanden
CI-Integration und Release-Builds wurden abgeschlossen, die gesamte Entwicklungszeit betrug rund 72 Stunden

Die finale Codebasis besteht aus rund 20.150 Zeilen in 72 Dateien
Zu den zentralen Dateien gehören Module wie layout, style, platform und browser
Cargo.lock ist leer, das heißt: vollständig eigenständig lauffähig ohne externe Rust-Pakete
Auf GitHub können CI-gebaute Binärdateien und der Quellcode direkt heruntergeladen werden
- https://github.com/embedding-shapes/one-agent-one-browser/releases

Die Kombination „eine Person + ein Agent“ ist effizienter als der Einsatz von Tausenden Agenten
Ein einzelner Agent kann über längere Zeit an einer Codebasis arbeiten und dabei echte Fortschritte erzielen
Es gibt Potenzial zur Skalierung in einer Form, bei der mehrere Menschen jeweils ihren eigenen Agenten haben
Langsamer zu werden kann paradoxerweise zu schnelleren und besseren Ergebnissen führen
Die Rolle des Menschen, der den Agenten steuert, könnte wichtiger sein als das Systemdesign

Insgesamt ist dies ein Beispiel dafür, dass auf die Frage „Beschleunigt sich Entwicklung, wenn man mehrere Agenten einsetzt?“
die Zusammenarbeit zwischen einem einzelnen Menschen und einem einzelnen Agenten realistischer und effizienter sein könnte