1 Punkte von GN⁺ 2026-01-23 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Das Hallucination-Check-Tool von GPTZero analysierte 4.841 von 5.290 für NeurIPS 2025 angenommenen Papers und bestätigte mehr als 100 „halluzinierte Zitate“ (hallucinated citations)
  • In zahlreichen Papers wurden nicht existierende Autor:innen, falsche DOI·URL und erfundene Titel sowie weitere Spuren von KI-Generierung gefunden
  • GPTZero bezeichnet solche Fehler als „vibe citing“ und beschreibt sie als Zitate, die reale Paper-Informationen mischen oder abwandeln, damit sie plausibel wirken
  • Alle Fälle wurden von menschlichen Expert:innen verifiziert; das Tool weist eine sehr niedrige Falsch-Negativ-Rate auf (99 % Erkennung) und markiert Verdachtsfälle bewusst konservativ
  • Der Fall gilt als Beispiel dafür, dass im Prozess des Schreibens und Prüfens von Forschungsarbeiten eine Automatisierung der Erkennung von KI-bedingten Zitationsfehlern notwendig ist

Ergebnisse von GPTZeros Analyse der NeurIPS-2025-Papers

  • GPTZero scannte 4.841 von 5.290 angenommenen Papers für NeurIPS 2025 und fand mehr als 100 halluzinierte Zitate
    • Jeder Fall wurde durch menschliche Prüfung als tatsächlich nicht existierendes Zitat bestätigt
    • Beispielsweise wurden zahlreiche Zitate gefunden, die nicht existierende Journalnamen, Autorennamen und DOI enthielten
  • GPTZero ordnet solche Zitationsfehler als Spuren von KI-Generierung (vibe citing) ein
    • Typisch sind gefälschte Zitate, die reale Paper-Titel und Autor:innen kombinieren oder abwandeln
    • Einige verwenden Titel, die realen Papers ähneln, lassen sich aber an abweichenden Jahren, Quellen oder Autor:innen als fehlerhaft erkennen

Definition und Typen von „Vibe Citing“

  • GPTZero definiert „vibe citing“ als „Zitate, die generative KI durch Kombination oder Abwandlung realer Quellen erzeugt“
    • Dazu gehören Fälle mit manipulierten oder synthetisierten Autorennamen, Titeln, Verlagen und DOI
    • In manchen Fällen werden real existierende Papers nur teilweise zitiert, in anderen werden gefälschte Journalnamen erzeugt
  • Dagegen werden einfache Tippfehler, tote Links oder fehlende Seitenzahlen als menschliche Fehler betrachtet und ausgeschlossen
  • GPTZero stellt die Unterschiede zwischen echten, fehlerhaften und halluzinierten Zitaten in einer Vergleichstabelle dar
    • Beispiel: Wenn das Paper „Deep learning“ zu „Samuel LeCun Jackson. Deep learning. Science & Nature, 2021.“ umgeformt wird, wird es als halluziniertes Zitat eingestuft

Funktionen des Hallucination-Check-Tools

  • Hallucination Check ist ein KI-basiertes Erkennungssystem, das die Prüfung von Zitaten automatisiert
    • Es markiert automatisch Zitate, die sich online nicht verifizieren lassen
    • Es unterstützt Autor:innen, Herausgeber:innen und Gutachter:innen dabei, Zitationsfehler schnell zu prüfen
  • Einsatzphasen
    1. Autor:innen prüfen die Zitate ihrer Papers vor der Einreichung automatisch
    2. Gutachter:innen identifizieren nicht verifizierte Zitate schnell
    3. Konferenz- und Journal-Redaktionen können zusammen mit dem AI Detector gleichzeitig Spuren von KI-generiertem Schreiben und Zitationsfehler erkennen

Genauigkeit von GPTZeros Prüfung

  • Hallucination Check hat eine sehr niedrige Falsch-Negativ-Rate (99 % Erkennungsgenauigkeit)
    • Das heißt, die Wahrscheinlichkeit, ein tatsächlich halluziniertes Zitat zu übersehen, ist extrem gering
    • Dafür ist die Falsch-Positiv-Rate aufgrund der konservativen Erkennung etwas höher
  • GPTZero fand mit derselben Methode auch in ICLR 2026, Deloitte-Berichten und anderen Quellen Dutzende KI-bedingte Zitationsfehler

Bedeutung für Wissenschaft und Publikationsökosystem

  • Der Fall NeurIPS 2025 macht zusammen mit der zunehmenden Nutzung von KI-Tools beim Verfassen von Papers das Problem einer sinkenden Zuverlässigkeit von Zitaten sichtbar
  • GPTZero arbeitet mit dem ICLR-Organisationskomitee zusammen, um ein automatisches Prüfsystem für künftige Einreichungen aufzubauen
  • Solche Versuche dürften zu mehr Effizienz und Transparenz im Begutachtungsprozess sowie zu stärkeren Prüfmechanismen für KI-generierte Inhalte führen

Noch keine Kommentare.

Noch keine Kommentare.