- Das Hallucination-Check-Tool von GPTZero analysierte 4.841 von 5.290 für NeurIPS 2025 angenommenen Papers und bestätigte mehr als 100 „halluzinierte Zitate“ (hallucinated citations)
- In zahlreichen Papers wurden nicht existierende Autor:innen, falsche DOI·URL und erfundene Titel sowie weitere Spuren von KI-Generierung gefunden
- GPTZero bezeichnet solche Fehler als „vibe citing“ und beschreibt sie als Zitate, die reale Paper-Informationen mischen oder abwandeln, damit sie plausibel wirken
- Alle Fälle wurden von menschlichen Expert:innen verifiziert; das Tool weist eine sehr niedrige Falsch-Negativ-Rate auf (99 % Erkennung) und markiert Verdachtsfälle bewusst konservativ
- Der Fall gilt als Beispiel dafür, dass im Prozess des Schreibens und Prüfens von Forschungsarbeiten eine Automatisierung der Erkennung von KI-bedingten Zitationsfehlern notwendig ist
Ergebnisse von GPTZeros Analyse der NeurIPS-2025-Papers
- GPTZero scannte 4.841 von 5.290 angenommenen Papers für NeurIPS 2025 und fand mehr als 100 halluzinierte Zitate
- Jeder Fall wurde durch menschliche Prüfung als tatsächlich nicht existierendes Zitat bestätigt
- Beispielsweise wurden zahlreiche Zitate gefunden, die nicht existierende Journalnamen, Autorennamen und DOI enthielten
- GPTZero ordnet solche Zitationsfehler als Spuren von KI-Generierung (vibe citing) ein
- Typisch sind gefälschte Zitate, die reale Paper-Titel und Autor:innen kombinieren oder abwandeln
- Einige verwenden Titel, die realen Papers ähneln, lassen sich aber an abweichenden Jahren, Quellen oder Autor:innen als fehlerhaft erkennen
Definition und Typen von „Vibe Citing“
- GPTZero definiert „vibe citing“ als „Zitate, die generative KI durch Kombination oder Abwandlung realer Quellen erzeugt“
- Dazu gehören Fälle mit manipulierten oder synthetisierten Autorennamen, Titeln, Verlagen und DOI
- In manchen Fällen werden real existierende Papers nur teilweise zitiert, in anderen werden gefälschte Journalnamen erzeugt
- Dagegen werden einfache Tippfehler, tote Links oder fehlende Seitenzahlen als menschliche Fehler betrachtet und ausgeschlossen
- GPTZero stellt die Unterschiede zwischen echten, fehlerhaften und halluzinierten Zitaten in einer Vergleichstabelle dar
- Beispiel: Wenn das Paper „Deep learning“ zu „Samuel LeCun Jackson. Deep learning. Science & Nature, 2021.“ umgeformt wird, wird es als halluziniertes Zitat eingestuft
Funktionen des Hallucination-Check-Tools
- Hallucination Check ist ein KI-basiertes Erkennungssystem, das die Prüfung von Zitaten automatisiert
- Es markiert automatisch Zitate, die sich online nicht verifizieren lassen
- Es unterstützt Autor:innen, Herausgeber:innen und Gutachter:innen dabei, Zitationsfehler schnell zu prüfen
- Einsatzphasen
- Autor:innen prüfen die Zitate ihrer Papers vor der Einreichung automatisch
- Gutachter:innen identifizieren nicht verifizierte Zitate schnell
- Konferenz- und Journal-Redaktionen können zusammen mit dem AI Detector gleichzeitig Spuren von KI-generiertem Schreiben und Zitationsfehler erkennen
Genauigkeit von GPTZeros Prüfung
- Hallucination Check hat eine sehr niedrige Falsch-Negativ-Rate (99 % Erkennungsgenauigkeit)
- Das heißt, die Wahrscheinlichkeit, ein tatsächlich halluziniertes Zitat zu übersehen, ist extrem gering
- Dafür ist die Falsch-Positiv-Rate aufgrund der konservativen Erkennung etwas höher
- GPTZero fand mit derselben Methode auch in ICLR 2026, Deloitte-Berichten und anderen Quellen Dutzende KI-bedingte Zitationsfehler
Bedeutung für Wissenschaft und Publikationsökosystem
- Der Fall NeurIPS 2025 macht zusammen mit der zunehmenden Nutzung von KI-Tools beim Verfassen von Papers das Problem einer sinkenden Zuverlässigkeit von Zitaten sichtbar
- GPTZero arbeitet mit dem ICLR-Organisationskomitee zusammen, um ein automatisches Prüfsystem für künftige Einreichungen aufzubauen
- Solche Versuche dürften zu mehr Effizienz und Transparenz im Begutachtungsprozess sowie zu stärkeren Prüfmechanismen für KI-generierte Inhalte führen
Noch keine Kommentare.