Cursors neuestes „Browser-Experiment“ deutet ohne Belege auf Erfolg hin
(embedding-shapes.github.io)- Cursor gab bekannt, ein Experiment mit „autonomen Coding-Agenten“, die wochenlang laufen, durchgeführt zu haben, um zu untersuchen, ob sich Projekte automatisieren lassen, für die menschliche Teams mehrere Monate benötigen
- Um dieses System zu validieren, setzte das Unternehmen das Ziel, „einen Webbrowser von Grund auf zu bauen“, und behauptete, die Agenten hätten in etwa einer Woche mehr als 1 Million Zeilen Code geschrieben
- Das veröffentlichte GitHub-Repository (fastrender) zeigt jedoch zahlreiche Kompilierungsfehler und fehlgeschlagene CI-Läufe; damit ist bestätigt, dass es sich nicht um einen lauffähigen Browser handelt
- Cursor legte weder einen Nachweis der Funktionsfähigkeit noch eine reproduzierbare Demo oder einen buildbaren Commit vor; konkrete Belege für den Erfolg des Experiments fehlen ebenfalls
- Dennoch formulierte Cursor, „die Agenten hätten bei einem großen Projekt bedeutende Fortschritte erzielt“, und hinterließ so den Eindruck eines Erfolgs, ohne die tatsächliche Leistung zu belegen
Überblick über Cursors Blog-Experiment
- Am 14. Januar 2026 veröffentlichte Cursor den Blogbeitrag „Scaling long-running autonomous coding”
- Ziel war es, zu erforschen, „wie weit sich Projekte, für die menschliche Teams Monate brauchen, mit autonomen Coding-Agenten skalieren lassen“
- Nach mehreren Versuchen mit unterschiedlichen Ansätzen erklärte das Unternehmen, ein System erreicht zu haben, „das Koordinationsprobleme löst und ohne einen einzelnen Agenten auf große Projekte skaliert werden kann“
- Zur Validierung wurde ein Experiment durchgeführt, bei dem „ein Webbrowser von Grund auf gebaut“ werden sollte; laut Cursor schrieben die Agenten in etwa einer Woche über 1 Million Zeilen Code in 1.000 Dateien
- Der Quellcode wurde im GitHub-Repository wilsonzlin/fastrender veröffentlicht
Unklarheit über die Versuchsergebnisse
- Cursor behauptet, „neue Agenten hätten die Codebasis verstanden und bedeutende Fortschritte erzielt“ und „Hunderte Worker hätten gleichzeitig in denselben Branch gepusht“
- Ob der Browser tatsächlich funktioniert, wird jedoch nicht ausdrücklich gesagt
- Der Beitrag enthält ein Screenshot-Video, aber keine lauffähige Demo und keine konkrete Beschreibung der Ergebnisse
- Abgesehen von der Formulierung, „einen Browser von Grund auf zu bauen ist sehr schwierig“, wird kein Beleg für Funktionsfähigkeit geliefert
Ergebnis der Überprüfung der Codebasis
- Beim direkten Build des Repositories schlägt die Kompilierung der „fastrender“-Bibliothek fehl (34 Fehler, 94 Warnungen)
- Auch in den jüngsten GitHub-Actions-Läufen wurden Workflow-Fehler und zahlreiche fehlgeschlagene Kompilierungen festgestellt
- Unter den letzten 100 Commits gibt es keinen einzigen, der erfolgreich gebaut hat
- Die Inhalte des Codes werden als Output auf dem Niveau von „AI slop“ ohne erkennbare Absicht oder Struktur bewertet
- Es wirkt so, als seien nicht einmal die Befehle
cargo buildodercargo checkausgeführt worden - Das zugehörige Issue #98 ist derzeit ebenfalls offen
- Es wirkt so, als seien nicht einmal die Befehle
Probleme bei Reproduzierbarkeit und Glaubwürdigkeit
- Cursors Blog liefert überhaupt keine Erklärung dazu, wie man den Code ausführt, welches Ergebnis zu erwarten ist oder wie er funktioniert
- Es werden weder eine reproduzierbare Demo noch Build-Anweisungen oder ein verifizierter Commit (Tag/Release/Commit) bereitgestellt
- Dennoch lassen Aufbau und Formulierungen des Beitrags ihn wie einen „funktionierenden Prototyp“ erscheinen
- Cursor sagt zwar nicht ausdrücklich, dass es „funktioniert“, macht also keine falsche Tatsachenbehauptung, hinterlässt aber den Eindruck eines Erfolgs
Fazit und Bewertung
- Cursor behauptete nicht, es handle sich um einen „Browser auf Produktionsniveau“, ließ das Experiment aber mit Formulierungen wie „bedeutende Fortschritte“ und „einen Browser bauen“ wie einen Erfolg wirken
- Tatsächlich fehlen jedoch jegliche Belege für Funktionsfähigkeit, buildbaren Code oder reproduzierbare Ergebnisse
- Die Behauptung, „Hunderte Agenten hätten zusammengearbeitet und bei einem Großprojekt Fortschritte erzielt“, ist eine Behauptung ohne jeden Beleg
- Nicht einmal der Mindestmaßstab eines „kompilierbaren Zustands, der eine einfache HTML-Datei rendern kann“ wird erreicht
- Letztlich zeigt Cursors Experiment weniger das Potenzial skalierter autonomer Coding-Systeme als vielmehr die Grenzen großangelegter Codegenerierung
5 Kommentare
Das hat eigentlich nur erfolgreich gezeigt, dass Entwickler bislang noch nicht ersetzt werden können~
Erfolgreiches Ergebnis = Ihr könnt uns also doch noch nicht feuern, ihr Manager-Arschlöcher
Haha
Verwandter Artikel – https://de.news.hada.io/topic?id=25859
Hacker-News-Kommentare
Der wichtigste Punkt diese Woche hätte sein sollen, dass das Experiment am Ende nur auf dem Niveau eines nicht funktionsfähigen Wrappers um Servo (einen Rust-basierten Browser) lag
Der entsprechende Kommentar ist hier
Mit den neuesten LLMs könnte das wohl auch ziemlich effektiv für License Washing oder das Plagiieren von Abhängigkeiten sein. Wäre ein interessanter neuer Benchmark
Ein Hoch auf Cursor für die heutige Unterhaltung
Aber dann stellte sich heraus, dass es nicht einmal eine Engine gibt und alles komplett kaputt ist — Cursor ist wirklich blamabel
Cursors offizieller Blogpost war in einem ziemlich vorsichtigen Ton geschrieben,
aber auf Twitter entstand ein übertriebener Eindruck im Sinne von „Mit GPT-5.2 wurde ein Browser gebaut“
Tatsächlich wurden Tausende Agenten getrennt voneinander über Wochen Commits anhäufen lassen, aber das Ergebnis funktioniert noch immer nicht
oursodertheirskann man sie immer auflösenIch habe selbst nachgeprüft und für die letzten 100 Commits
cargo checkausgeführtDas Ergebnis: alles fehlgeschlagen. Siehe Ergebnis-Log
Diese Art von PR wirkt letztlich wie Teil einer Fundraising-Strategie
Schon früher wurden mehrfach vage Posts veröffentlicht, etwa darüber, wie viel Code ein internes Modell geschrieben habe
Das heißt nicht, dass gar nichts dahintersteckt, aber es ist schade, dass die Ergebnisse nicht öffentlich geteilt werden
Cursor war einmal ein großes Thema, aber inzwischen sind terminalbasierte Agenten im Trend
Auch unser Unternehmen will den Vertrag mit Cursor beenden und zu Claude Code wechseln
Vermutlich ist dieses Browser-Projekt ein Versuch, wieder Aufmerksamkeit zu bekommen
Bei der Ankündigung von GPT-5 war es ähnlich. Der tatsächliche Fortschritt verlangsamt sich
Am Ende lautet die Antwort nicht Vertrauen, sondern Verifikation
Cursor baut in einem ähnlichen Experiment auch einen Excel-Klon
Laut dem GitHub-Repository
waren von 160.000 Workflows nur 247 erfolgreich, die meisten scheiterten an überschrittenem Budget
Solche Einschränkungen kümmern die Agenten überhaupt nicht
Der neueste Commit lässt sich jetzt bauen und ausführen (zumindest auf dem Mac)
Aber es ist immer noch ein 3-Millionen-Zeilen-Chaos
Die Seite aus Cursors Promo-Video wird nicht gerendert. Vermutlich wurde ein anderer Build verwendet
cargo checkläuft durch, aber wenn man sichgit logansieht, wirkt etwas verdächtigEs gibt Spuren, dass nicht Agenten, sondern Menschen direkt Änderungen vorgenommen haben
Siehe Analyse des Commit-Logs
Ich denke, der Originalpost war einfach nur eine Clickbait-Überschrift
Die Formulierung „Tausende AI-Agenten haben einen Browser gebaut“ ist viel zu reißerisch
Schade, dass der Ausdruck „Fake News“ politisch vergiftet wurde. Für diesen Bereich passt er perfekt
Cursors CEO behauptete, man habe in Rust eine Rendering-Engine und eine JS-VM von Grund auf gebaut,
aber die tatsächliche Abhängigkeitsliste zeigt,
dass Bibliotheken auf Servo-Basis wie html5ever, cssparser und rquickjs einfach verwendet wurden
Am Ende war es nur ein Wrapper um Servo, und nicht einmal einer, der kompiliert
Die meisten Leute würden das beim Blick in den Code sofort erkennen; vermutlich dachte man, die breite Masse prüft das nicht nach
Auf diese Weise verbreiten sich falsche Vorstellungen, und selbst wenn später korrigiert wird, interessiert es niemanden mehr
Dass das dann 3M Zeilen sein sollen, ist schon komisch
Siehe dazu hier
Das ist im Browser einer der schwierigsten Bereiche
Ich halte diesen Marketing-Ansatz eher für ein Eigentor
Cursors Design und UX sind hervorragend, aber bei tiefergehender Arbeit gibt es zu viele Bugs
Mit der Ergänzung von Claude-Modellen wurde es etwas besser, aber es ist immer noch schlechter als Antigravity
Außerdem ist das $20-Abolimit schnell aufgebraucht. Dass Modelle zehnmal besser und zehnmal billiger werden, ist eher unwahrscheinlich
Wenn man sieht, wie sich OpenAIs Geschäftsmodell in Richtung Werbung bewegt,
kommt einem der Gedanke, dass Google diese Technologie realistischer verstanden hatte
Solche Geschichten sind am Ende vor allem für die Verkäufer der Schaufeln bestimmt
Ein CEO ohne tiefere Ahnung könnte auf solche Nachrichten hereinfallen und tatsächlich echte Mitarbeiter entlassen