Nicos Datenraum: Vorwurf des Papermark-Code-Diebstahls erhoben
(twitter.com/mfts0)- Es wurde öffentlich der Vorwurf erhoben, dass Nicos Datenraum-Produkt kein direkt selbst entwickeltes Ergebnis sei, sondern offenbar aus Code mit Open-Source- und Enterprise-Lizenz von Papermark übernommen wurde
- Im Mittelpunkt steht die Frage, ob Urheberrechte und Lizenzbedingungen verletzt wurden; die Person, die den Vorwurf erhebt, fordert, das Produkt sofort offline zu nehmen
- Daraus folgt scharfe Kritik, dass es sich nicht um „move fast and break things“, sondern eher um Betrug handle
- Es wird zudem darauf hingewiesen, dass sich die Kontroverse um das Produkt auch auf Zweifel an Nicos übrigen Geschäften ausweiten könnte
- Garry Tan, Jared Friedman und Y Combinator wurden gemeinsam markiert, wodurch sich die Debatte auch zu einer Frage des Rufs der YC-Community ausweitet
Vorwurf des Papermark-Code-Diebstahls
- Es wurde öffentlich der Vorwurf erhoben, dass Nicos Datenraum-Produkt nicht eigenständig entwickelt wurde, sondern offenbar aus Code mit Open-Source- und Enterprise-Lizenz von Papermark übernommen wurde
- Die Person, die den Vorwurf erhebt, hält es für schwer, dies lediglich als schnelle Produktentwicklung oder „vibe coding“ zu betrachten, und sieht die Möglichkeit von Urheberrechts- und Lizenzverletzungen
- Die Forderungen sind klar
- Das betreffende Produkt solle sofort offline genommen werden
- Falls sich die Verletzung bestätige, könne dies als schwerwiegender als ein bloßer Fehler angesehen werden
Ausweitung der Kritik
- Die Kritik beschränkt sich nicht nur auf Nicos Datenraum-Produkt, sondern stellt auch die Glaubwürdigkeit seiner übrigen Geschäfte insgesamt infrage
- Da Garry Tan, Jared Friedman und Y Combinator markiert wurden, geht es über einen persönlichen Streit hinaus und wird auch mit dem Ruf der YC-Community verknüpft
- Auf Grundlage der derzeit öffentlich bekannten Informationen stehen vor allem der Vorwurf und die Forderungen im Mittelpunkt; zusätzliche Überprüfungen oder Gegenargumente liegen nicht vor
1 Kommentare
Hacker-News-Kommentare
Wenn man einen Screenshot einer Webseite in ein Tool wie Figma Make steckt, kann man eine ziemlich ähnliche Kopie erstellen
Genau so wirkt es auf dem Screenshot: sehr ähnlich, aber nicht vollständig identisch. Dass auch viele Formulierungen gleich sind, dürfte wahrscheinlich daran liegen. Dass nicht einmal die Texte umgeschrieben wurden und man das ebenfalls nicht einem generativen Text-Tool überlassen hat, ist einfach schlampig
Liest man andere Kommentare auf Twitter, scheint es, als hätte man die AI angewiesen, Papermark zu kopieren
In den AI-Kommentaren gibt es Spuren davon, dass die Seite angeblich an einer „reference“ ausgerichtet wurde
https://xcancel.com/ffumarola/status/2070479755892371713#m
Ihre Antwort lautete so:
Es würde mich nicht besonders überraschen, wenn Nico ernsthaft glaubt, „Wir haben den Code nicht kopiert“ sei eine vernünftige Verteidigung. Das wirkt wie eine Art starre Regel, und extreme „shape rotator“-Typen tun sich oft schwer mit Grauzonen wie dem Recht. In der Praxis ist Copyright-Verletzung häufig wie der Test bei Pornografie: Man erkennt es, wenn man es sieht
Irgendwo hat er auch behauptet, diese Firma bzw. Branche sei der wichtigste Anwendungsfall für AI weltweit. Ich habe keinen Zweifel daran, dass sie kopiert haben, und halte sie zumindest nicht für vertrauenswürdig
https://x.com/nico_laqua/status/2061130574358773852?s=20
Hätten sie so etwas bei einem Unternehmen gemacht, das deutlich klagefreudiger ist, wäre die Wahrscheinlichkeit einer Klage ziemlich hoch, und die Erfolgschancen lägen aus meiner Sicht ungefähr bei 50:50. Schwer zu sagen ist, ob das als Kopie kreativer bzw. künstlerischer Elemente gewertet würde oder nur als Nachbau der Funktionsweise; Funktionen zu kopieren ist in Ordnung, aber wenn man die gesamte User Experience übernimmt, ist man schnell bei einer Copyright-Verletzung
Auch die Texte sind aus meiner Sicht eher standardisiert und bei einer Lösung für virtuelle Datenräume durchaus zu erwarten
Kann jemand etwas mehr Hintergrund zu diesem Thread geben? Ich weiß überhaupt nicht, wer Nico ist, was Papermark ist oder was es macht.
Davon abgesehen wirkt es so, als würden sich Leute nicht mehr nur darauf beschränken, bestehende Lösungen oder Projekte per Vibe Coding nachzubauen, sondern sich auch immer mehr daran gewöhnen, Open-Source-Code zu „stehlen“ und nach Belieben zu verwenden, ohne die moralischen, ethischen und rechtlichen Grundannahmen von Open Source einzuhalten. Es fühlt sich so an, als nähmen Open-Source-Verstöße überall zu, ohne dass es große rechtliche Folgen gäbe.
Außerdem verstehen viele der neuen Entwickler, die nur über AI hereingekommen sind, nicht oder es ist ihnen egal, dass FOSS nicht „gratis wie Freibier“, sondern frei bedeutet.
Ich arbeite an einer GPL3-Bibliothek zum Parsen binärer Datendateien von Hardware-Audio-Samplern. Jemand hat auf Basis meiner Bibliothek eine App gebaut, mit der man verschiedene Dinge erledigen kann, und hat die GPL3-Lizenz eingehalten.
Kürzlich hat jedoch jemand diese App komplett per Vibe Coding geklont und sogar eine Website mit einem Kauflink für ungefähr 60 Dollar online gestellt. Es war eine so dreiste Kopie, dass nur die Farben anders waren und die UI exakt gleich aussah, und die GPL3-Bedingungen wurden überhaupt nicht eingehalten. Die Betreiber haben den Beitrag aus der Liste entfernt und den Entwickler der Kopie gesperrt, und die Foren-Community hat den ursprünglichen App-Entwickler unterstützt. Es wurde auch eine DMCA-Takedown-Anfrage verschickt, und ein paar Tage später war die Klon-Website offline.
Der ursprüngliche App-Entwickler hatte Glück, weil es für Beiträge zu diesem Hersteller praktisch nur ein einziges großes Forum gibt und die Betreiber dort AI-bezogene Dinge ohnehin nicht mögen. Ironischerweise hat auch der ursprüngliche App-Entwickler seine eigene Arbeit komplett per Vibe Coding erstellt. Ohne dieses Forum und seine Betreiber wären sowohl der ursprüngliche App-Entwickler als auch ich als Maintainer der GPL3-Bibliothek ehrlich gesagt erledigt gewesen.
Zentralisierung hat Vorteile. Ohne sie sehe ich kaum Alternativen außer einer breiten Bewegung, die alle zurück zu Closed Source treibt und eine Debatte darüber erzwingt, fremde Arbeit zu respektieren. Bisher beruhte das alles auf Reputation und dem Backlash der Community.
Unternehmen gewöhnen sich daran, mit allem davonzukommen. „Move fast and break things“ war ursprünglich ein Spruch über Technik, inzwischen ist es eine Haltung zum Recht geworden. Uber hat diese Entwicklung populär gemacht, und jetzt machen es alle genauso. Dass AI das Urheberrecht bricht, ist Teil derselben Entwicklung.
Wegen dieser neuen Denkweise, dass Gesetze für Verlierer seien, stehen uns wohl harte Zeiten bevor.
Man muss inzwischen wohl davon ausgehen, dass im Internet praktisch alles von allen einfach genommen wird.
Denn die einzige sichere Art zu verlieren ist, gar nicht erst mitzuspielen.
Papermark ist die Open-Source-Alternative zu DocSend. Es kann selbst gehostet oder als gehosteter Dienst genutzt werden und ist deutlich kosteneffizienter als DocSend, weshalb es ziemlich beliebt ist.
Corgi ist ein von YC finanziertes Insurance-Startup, das anderen YC-Startups Versicherungen verkauft. Nico ist der Gründer. Das Unternehmen hat kürzlich 100 Millionen Dollar bei einer Bewertung von etwa 3 Milliarden Dollar eingesammelt und gehört derzeit zu den Firmen, die YC besonders stark pusht.
Für das Insurance Underwriting werden viele Dokumente benötigt, deshalb zahlte Corgi jeden Monat mehrere Tausend Dollar an DocSend. Aus irgendeinem Grund scheint Corgi ein zwölfköpfiges Team aufgebaut zu haben, um eine eigene DocSend-Alternative namens Dataroom zu entwickeln. Und Corgi entschied offenbar, das als günstigere DocSend-Variante mit Preisen ab 10 Dollar pro Monat zu positionieren und daraus in einem ohnehin schon überfüllten Markt ein SaaS-Produkt zu machen.
Papermark bemerkte sofort, dass Corgis Dataroom in großem Umfang dieselben Formulierungen und dieselbe Struktur wie das eigene Open-Source-Produkt verwendet. Daher kam Papermark zu dem Schluss, dass Corgi seine Arbeit ohne Quellenangabe übernommen habe. Corgi bestreitet das und behauptet, wortgleiche Übereinstimmungen zwischen den Produkten seien bloßer Zufall.
Ein anderes YC-Startup, Delve, wurde dabei erwischt, dass es tatsächlich das getan hatte, was Corgi hier vorgeworfen wird, und noch viel mehr, und wurde daraufhin aus YC ausgeschlossen.
So wie ich es sehe, besteht seine Logik im Wesentlichen aus zwei Punkten:
Der größte Hinweis hier sind jedoch das identische Layout und die identischen Formulierungen der beiden Produkte. Auch einem LLM zu sagen: „Schreibe dieses Produkt und erstelle eine 1:1-Kopie davon“, ist nach jeder vernünftigen Definition immer noch Kopieren. Zu behaupten, es sei nichts kopiert worden, ergibt keinen Sinn.
ShadCN ist das beliebteste Design-System, das AI in über 90 % der Fälle automatisch auswählt, und auf Plattformen wie lovable ist es fast der Standard.
Google hat die API kopiert, die Implementierung jedoch als Clean Room belassen, und das wurde letztlich ausdrücklich als Fair Use eingestuft. Wenn Fair Use sogar auf so strenge Gegenstände wie die Reimplementierung einer API angewendet wird, dann wohl auch auf viel unklarere Dinge wie das Kopieren von UI oder Layout.
Ich verstehe nicht, warum irgendjemand das ehemalige Twitter noch ernsthaft benutzt.
Selbst wenn sie den Code, wie behauptet, nicht per Copy-and-paste übernommen haben, könnte es in der Praxis darauf hinauslaufen, dass ein LLM denselben Code auf Basis gecrawlter Repositories reproduziert und die Lizenz nicht respektiert hat.
Das wäre ein guter zivilrechtlicher Fall für die Gerichte. Ihre Verteidigung wirkt ungefähr wie: „Wir haben das LLM nur angewiesen, deine Arbeit zu reproduzieren, also haben nicht ‚wir‘ den Code kopiert.“ Das hinterlässt einen üblen Beigeschmack.
Die betreffende Lizenz: https://github.com/papermark/papermark?tab=License-1-ov-file
Es handelt sich um die AGPL, was im Grunde bedeutet, dass der Quellcode offengelegt werden muss, selbst wenn Nutzer nur über ein Netzwerk mit der Software interagieren. Auch ein Projekt, das diesen Code verwendet, müsste unter der AGPL stehen.
Es gibt aber Möglichkeiten, das getrennt zu umgehen. Nur weil man zum Beispiel einen AGPL-zertifizierten Server nutzt, heißt das nicht, dass auch der Code mit der Business-Logik davon betroffen sein muss.
Vor allem wenn man frühere Kontroversen gesehen hat, hätte man Wege finden können, das Produkt so zu entwerfen, dass es der Lizenz entspricht.
Das setzt allerdings voraus, dass tatsächlich Code kopiert wurde, und das wissen wir nicht sicher. Es sieht zwar sehr ähnlich aus, aber wie das tatsächlich durchgesetzt würde, ist unklar.
Die Urheberrechtsprobleme rund um solche Modelle sind wirklich ein einziges Chaos.
Die Tech-Branche wird alles dafür tun, Diebstahl zu normalisieren und das dann Innovation zu nennen.
Ein typisches YC-Startup-Manöver.