- Gegen Huawei wurden interne Vorwürfe erhoben, das Unternehmen habe große KI-Modelle von Qwen und DeepSeek kopiert und anschließend als eigenes Produkt unter dem Namen „Pangu“ präsentiert
- Laut Aussagen eines Mitarbeiters aus dem Pangu-Team basierten einige der tatsächlichen Modelle nicht auf Eigenentwicklung, sondern auf externen Open-Source-Modellen, die lediglich umbenannt wurden
- Technisch zeigte sich, dass wichtige Modelle wie 135B V2 und Pro MoE 72B in erheblichem Maß mit den Architekturen von Qwen und DeepSeek übereinstimmen
- Intern habe diese Praxis zu sinkender Moral und Abwanderung in der Forschung geführt; administrative Ineffizienz und intransparente Personalpolitik hätten die Probleme zusätzlich verschärft
- Es gebe zwar auch wirklich eigenständig entwickelte Modelle (etwa Pangu V3), doch die Klon-Praxis und eine Forschungskultur ohne Anerkennung hätten dem Vertrauen in die gesamte Organisation schweren Schaden zugefügt
- Der Whistleblower habe sich entschlossen, unter seinem echten Namen die Wahrheit offenzulegen, und fordere die Organisation zu Selbstreflexion und Veränderung auf
Die Tragödie von Pangu: Die schmerzhafte Innenansicht der großen Pangu-Modelle von Huaweis Noah Ark Lab
Vorstellung des Whistleblowers und die Stimmung vor Ort
- Der Verfasser gehört zum Huawei-Noah-Pangu-Team für große Modelle und habe seine Identität durch interne Angaben zu wichtigen Organisations- und Projektstrukturen sowie zur Führungsbesetzung verifiziert
- Das Pangu-Projekt habe in der Praxis eher einer Lieferorganisation als einer Forschungsorganisation geglichen und unter wiederholten Deadlines, Überlastung sowie ständigem Druck durch Bewertungen und Berichte gelitten
- Die Arbeitsbelastung und die Bürokratie seien extrem gewesen; längere Trennungen von der Familie, Unterbringung in Firmenunterkünften und Wochenendarbeit seien häufig vorgekommen
- Statt Forschungsautonomie und Kreativität habe faktisch eine Unternehmenskultur dominiert, die sich an Lieferterminen und Leistungskennzahlen der einzelnen Produktlinien (Cloud, ICT usw.) orientierte
Schlaflose Nächte, niedergetretenes Schöpferbewusstsein
- Nach der Kontroverse um das angebliche Plagiat des Qwen-Modells hätten einige Forschende zugleich Scham, Wut und Ohnmachtsgefühle erlebt
- Der Whistleblower fürchte zwar die Vergeltung eines riesigen Unternehmens und seiner internen Netzwerke, habe sich aber aus Gewissensgründen zur Offenlegung entschlossen, weil er die weitere Vertuschung von Fakten und falsche Außendarstellung nicht mehr ertragen könne
Technische Hürden und der Beginn des Plagiats
- Die frühen Pangu-Modelle hätten versucht, auf Basis von Huaweis Ascend-NPU ein eigenes Training durchzuführen, dabei jedoch mit schweren Problemen wie ineffizientem Tokenizer und schwacher Modellleistung zu kämpfen gehabt
- Gegenüber GPU-basierten Modellen von Wettbewerbern (Alibaba, Zhipu) sei man zurückgefallen, und das Training eines eigenen dichten 230B-Modells sei gescheitert
- Daraufhin habe das Small-Model-Lab dies zwar als „Eigenentwicklung“ dargestellt, tatsächlich aber ein Qwen-1.5-(110B)-Modell geklont und leicht modifiziert, um daraus 135B V2 zu machen, das anschließend ausgeliefert wurde; auch intern seien Ähnlichkeiten bei Code und Struktur erkennbar gewesen
- Die wichtigste Führungsebene und das Management hätten diese Realität trotz Kenntnis geduldet und dies mit externem Leistungs- und Erfolgsdruck begründet
Echte technische Leistung: Pangu V3
- Nach langen Anstrengungen habe das Team das vollständig von Grund auf selbst entwickelte Modell Pangu V3 (135B Ultra) auf Ascend unabhängig trainiert
- Dabei seien verschiedene technische Hürden wie die Vereinheitlichung des Tokenizers und die Stabilisierung der Loss-Kurve überwunden worden, bis eine mit der Konkurrenz vergleichbare Leistung erreicht worden sei
- Diese Leistung sei ein Beleg für eigenständige Entwicklung großer Modelle statt für Plagiate gewesen und habe den Forschenden Stolz vermittelt
Die nicht anerkannte Mühe hinter der Arbeitsteilung
- Das Small-Model-Lab habe fortlaufend Daten, Code und Ergebnisse übernommen, um Modelle leicht zu verändern und zu verteilen; Erfolge und Belohnungen seien jedoch überwiegend an diese Organisation gegangen
- Dadurch hätten engagierte Forschende die Organisation verlassen oder bitter angemerkt, dies bleibe als Makel in ihrer technischen Laufbahn zurück
Zweiter Plagiatsfall wie 224B MoE/718B-Klon
- Auch bei der Entwicklung eines neuen 718B-MoE-Modells sei DeepSeekv3 nahezu unverändert kopiert und anschließend als Pangu Pro MoE 72B verteilt worden
- Intern habe man diese Praxis gekannt, doch aus Angst um das eigene Überleben und vor der Offenlegung der Wahrheit habe man darüber geschwiegen
Widersinnige Verwaltungssteuerung
- Auf die echten Forschenden seien strenge Prozesse, Modell-Linienführung und Audit-Systeme angewendet worden, was die Entwicklung verlangsamt habe
- Bei geklonten Modellen habe jedoch ein doppelter Maßstab gegolten: „Wenn es von oben kommt, geht alles durch“
Gründe für die Enthüllung und die Entscheidung zum Rücktritt
- Nach dem HonestAGI-Vorfall hätten Maßnahmen zum Krisenmanagement und interne Vertuschungsversuche auf Unternehmensebene begonnen
- Der Whistleblower erklärte, er könne sich nicht länger an „gefälschten Berichten“ und interner Komplizenschaft beteiligen, und habe die Entfernung seines Namens aus Teamlisten und Berichten sowie seine freiwillige Kündigungsabsicht angekündigt
Letzter Appell und Zuneigung zu den Kolleginnen und Kollegen
- Kolleginnen und Kollegen seien bereits zu ByteDance, DeepSeek, Tencent, Kuaishou und anderen Unternehmen gewechselt, was zeige, wie gravierend die Abwanderung von Huawei-Talenten sei
- Es wird betont, dass bei Innovation, passendem Umfeld und weniger politischen Hindernissen sogar eine Weltklasse-Entwicklung großer Modelle und Chips möglich gewesen wäre
- Der Verfasser erklärt, er nehme sogar mögliche Risiken für sich selbst und seine Familie durch die Wahrhaftigkeit dieser Inhalte und weitere Enthüllungen in Kauf
Zusätzliche Kontextangaben
- Im Fall des 135B-V2-Klons habe das Small-Model-Lab nur Vorteile wie Belohnungen und Anreize eingestrichen, während die Last von Downstream-Support und Wartung dem ursprünglichen Entwicklungsteam (4th brigade) aufgebürdet worden sei
- Auch bei der Autorennennung im technischen Pangu-Bericht seien Personen mit zentralem Beitrag zur tatsächlichen Modellentwicklung ausgeschlossen worden, während nicht beitragende Mitglieder des Small-Model-Labs aufgeführt worden seien, was auf verbreitete unfaire akademische Praktiken hindeute
1 Kommentare
Hacker-News-Kommentare