7 Punkte von GN⁺ 2026-01-29 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Ein Browser, der HTML und CSS rendern kann, wurde in nur 3 Tagen von einer Person und einem LLM-Agenten direkt in Rust implementiert
  • Das Projekt wurde mit rund 20.150 Zeilen Code fertiggestellt und enthält grundlegende Funktionen wie Scrollen, Zurück-Navigation und Headless-Modus
  • Es wurde so konzipiert, dass es ohne externe Rust-Bibliotheken unter Windows, macOS und Linux läuft
  • Der Entwicklungsprozess erfolgte in Zusammenarbeit mit dem Codex-Agenten: Der Mensch übernahm Koordination und Verifikation, der Agent das Schreiben des Codes
  • Das Ergebnis zeigt, dass die Kombination „eine Person + ein Agent“ effizienter ist als eine Vielzahl von Agenten

Projektüberblick

  • Das Ziel war, einen grundlegenden Browser, der HTML und CSS rendern kann, vollständig von Grund auf neu zu bauen
    • JavaScript wird nicht unterstützt
    • Der Entwickler begann „zum Spaß“ und setzte das Projekt in Zusammenarbeit mit dem LLM-Agenten (Codex) um
  • Es wurden Rahmenbedingungen wie Fertigstellung innerhalb von 3 Tagen, Verbot externer Rust-Abhängigkeiten und Unterstützung für die drei großen Betriebssysteme gesetzt
  • Der Browser verfügt über eine eigene Rendering-Engine und enthält Screenshot-Funktion, Link-Klicks und Regressionstests

Tag 1 – Erste Implementierung

  • Gestartet wurde mit dem Rendern von „Hello World“, danach kamen die Verarbeitung verschachtelter Tags und eine Screenshot-Funktion hinzu
  • Die HTML/CSS-Spezifikation wurde definiert, und für E2E-Tests wurde eine Bildvergleichsfunktion eingeführt
  • Schon nach einem Tag war der Stand erreicht, Websites per X11 und cURL abzurufen und zu rendern
    • Die Codebasis umfasste etwa 7.500 Zeilen, alle Dateien blieben unter 1.000 Zeilen

Tag 2 – Funktionsausbau

  • Um das Problem sich während der Tests öffnender Fenster zu lösen, wurde ein --headless-Modus hinzugefügt
  • Fenstergrößenanpassung, Kompatibilität, Performance und Schrift-Rendering wurden verbessert
  • Der Workflow bestand darin, Screenshots von Websites zu teilen und Codex diese nachbilden zu lassen
    • Den Großteil des Codes schrieb der Agent, der Mensch war für Prüfung und Freigabe zuständig

Tag 3–4 – Fertigstellung und plattformübergreifende Unterstützung

  • Wesentliche Browserfunktionen wie Scrollen, Debug-Logs und Zurück-Button wurden ergänzt
  • Unterstützung für macOS und Windows wurde implementiert und die Tests bestanden
  • CI-Integration und Release-Builds wurden abgeschlossen, die gesamte Entwicklungszeit betrug rund 72 Stunden

Ergebnis und Code-Statistiken

  • Die finale Codebasis besteht aus rund 20.150 Zeilen in 72 Dateien
  • Zu den zentralen Dateien gehören Module wie layout, style, platform und browser
  • Cargo.lock ist leer, das heißt: vollständig eigenständig lauffähig ohne externe Rust-Pakete
  • Auf GitHub können CI-gebaute Binärdateien und der Quellcode direkt heruntergeladen werden

Zentrale Erkenntnisse

  • Die Kombination „eine Person + ein Agent“ ist effizienter als der Einsatz von Tausenden Agenten
  • Ein einzelner Agent kann über längere Zeit an einer Codebasis arbeiten und dabei echte Fortschritte erzielen
  • Es gibt Potenzial zur Skalierung in einer Form, bei der mehrere Menschen jeweils ihren eigenen Agenten haben
  • Langsamer zu werden kann paradoxerweise zu schnelleren und besseren Ergebnissen führen
  • Die Rolle des Menschen, der den Agenten steuert, könnte wichtiger sein als das Systemdesign
  • Insgesamt ist dies ein Beispiel dafür, dass auf die Frage „Beschleunigt sich Entwicklung, wenn man mehrere Agenten einsetzt?“
    die Zusammenarbeit zwischen einem einzelnen Menschen und einem einzelnen Agenten realistischer und effizienter sein könnte

Noch keine Kommentare.

Noch keine Kommentare.