10 Punkte von GN⁺ 2025-07-17 | 2 Kommentare | Auf WhatsApp teilen
  • Zusammenfassung einer Diskussion und der Antworten im Subreddit /r/DataScience
  • Der Verfasser zeigt sich ernüchtert darüber, dass Data Science unter dem Namen „Generative AI“ ohne jede Verifikation oder Evaluation umgesetzt wird
  • Tatsächlich wurde nur eine einfache z-score-Berechnung mit von ChatGPT erzeugtem Code durchgeführt, und selbst ohne Modellleistungsbewertung ging es bis kurz vor die Auslieferung
  • In der Community wurden vor allem eine Unternehmenskultur nach dem Motto „Wenn es irgendwie funktioniert, rollen wir es aus“, mangelnde Validierung, Verantwortungsvermeidung und der Verzicht auf wissenschaftliche Ethik kritisiert
  • Viele Praktiker berichten von ähnlichen Problemen und äußern starke Sorge über eine Entwicklung, in der das Feld zur „Pseudowissenschaft“ verkommt
  • Einige meinten jedoch auch, dass man die praktische Nützlichkeit schneller Experimente und einfacher Lösungen verstehen müsse, und betonten eine ausgewogene Perspektive

Data Science Has Become a Pseudo-Science

  • Nach Master und Promotion in Europa war der Autor 10 Jahre lang in Industrie und Wissenschaft im Bereich Data Science tätig
  • In den letzten zwei Jahren häufen sich Phänomene, bei denen unter dem Namen „Generative AI“ Ergebnisse ohne jede Verifikation präsentiert werden
  • Als Beispiel nennt er ein Projekt zur Zeitreihen-Anomalieerkennung, bei dem mit von ChatGPT erzeugtem Code lediglich der z-score der Mittelwertsdifferenz berechnet wurde, während bereits über ein Deployment ohne jegliche Leistungsmetriken gesprochen wurde
  • Diese Vorgehensweise gleiche einer Pseudowissenschaft, die ohne wissenschaftliches Denken einer Blackbox Fragen stellt und ihren Antworten blind folgt, wobei selbst Nachfragen tabuisiert werden
  • Deshalb erwägt der Autor auch eine Rückkehr in die Wissenschaft und fragt in seinem Beitrag, ob andere Kolleginnen und Kollegen ähnliche Erfahrungen machen

Zusammenfassung der Kommentare

Wichtige zustimmende Positionen

  • Die Philosophie „Hauptsache, es läuft, dann deployen wir“ sei weit verbreitet (u/Illustrious-Pound266)
  • Es gebe auch Beispiele von Startups, die nur AI betonten und ohne Validierung oder Roadmap scheiterten (u/gothicserp3nt)
  • Unbeabsichtigte Biases oder Diskriminierung würden nicht ordentlich geprüft (u/tehMarzipanEmperor)
  • In den meisten Unternehmen würden RAG oder AI übertrieben vermarktet und eher auf Show als auf Genauigkeit ausgelegt (u/castleking, u/flowanvindir)
  • Die Stimmung im Arbeitsalltag sei „performance theater“ (u/Ty4Readin, u/faulerauslaender)
  • Übereilte Deployments, äußerlich eindrucksvolle Reports und AI-Einführung ohne Messung würden zum Normalfall (u/glittering_tiger8996, u/Emergency-Job4136)
  • Viele meinen auch, dass diese Probleme schon früher existierten und GenAI sie nur offener sichtbar mache (u/RoomyRoots, u/303uru, u/TARehman)
  • Trotz geringer Erklärbarkeit und niedriger Verlässlichkeit werde AI wegen ihrer Geschwindigkeit übernommen
  • Rechenschaftspflicht bei Unternehmensentscheidungen gehe zunehmend verloren (u/empathic_psychopath8, u/Jollyhrothgar)

Andere Sichtweisen

  • Wenn ein einfacher Ansatz ein Problem lösen kann, müsse man ihn auch pragmatisch anerkennen (u/AnarkittenSurprise)
  • In vielen Kommentaren hieß es auch, DS habe schon immer nichtwissenschaftliche Elemente enthalten oder sei „Science“ nur dem Namen nach (u/TaiChuanDoAddct, u/Time-Combination4710, u/LighterningZ)
  • Wichtiger als die bloße Nutzung von AI-Tools sei die Fähigkeit, sie verantwortungsvoll einzusetzen (u/Dror_sim, u/ResearchMindless6419)
  • Kritik an einem Niveau nach dem Motto: „Daten sind da, aber Logik fehlt“ und Pakete ausführen ohne Statistikkenntnisse (u/gyp_casino, u/tmotytmoty)
  • Viele betonen, dass Domain-Wissen und mathematisches Denken entscheidend seien und AI/Coding nur Werkzeuge seien (u/MightBeRong, u/Dror_sim)

Probleme bei Systemen und Ausbildung

  • Ein MSDS-Studium sei akademisch zwar nützlich, aber oft kaum relevant für den Arbeitsmarkt (u/throwaway_ghost_122)
  • Das Ausbildungsniveau sinke, und mit wachsender Nachfrage nach bloßen Abschlüssen leide die Qualität im Berufsfeld insgesamt (u/Yam_Cheap)
  • Auch in der Wissenschaft gebe es mehr unvalidierte Papers und oberflächliche Analysen; die Akademie sei also ebenfalls keine Ausnahme (u/joule_3am, u/Mishtle)

Geteilte Erfahrungen nach Branche

  • Versicherung und Gesundheitswesen verlangten wegen strenger Regulierung weiterhin Validierung und juristische Prüfung (u/Mishtle, u/mikka1)
  • Startups, Sales, Games und Teile der Fertigung seien dagegen stärker auf Tempo und Show ausgerichtet (u/Vercingetorex89, u/Brackens_World)
  • Auch im öffentlichen Sektor würden mit der Einführung von ChatGPT frühere Validierungssysteme erodieren (u/TheFluffyEngineer, u/joule_3am)

Zweifel und Ausstiegsüberlegungen

  • Viele Praktiker berichten, dass sie über einen Ausstieg aus dem Beruf oder einen Wechsel in die Wissenschaft nachdenken (u/thro0away12, u/Emotional_Plane_3500, u/candidFIRE)
  • Einige sehen darin aber auch eine Chance, dass wirklich kompetente Leute umso stärker auffallen können (u/OddEditor2467, u/sideshowbob01)

Satire und Resignation

  • „Heutzutage wird man schon mit einem import pandas zum Data Scientist“ (u/vesnikos)
  • In der Realität gehe es mehr darum, die Stimmung des Chefs zu bedienen als probabilistisch zu denken oder wissenschaftlich zu validieren (u/tmotytmoty, u/WignerVille)
  • Viele vertreten eine nüchterne Sicht: Früher war es so und heute auch; in Unternehmen ließ sich DS nie wirklich überzeugend Wissenschaft nennen (u/TaiChuanDoAddct, u/LighterningZ)

Fazit

  • Der Beitrag und die Kommentare zeigen deutlich, dass die aktuelle Data-Science-Praxis weniger von wissenschaftlicher Stringenz und Validierung als von schneller Auslieferung und AI-Marketing getrieben wird
  • Die Sorge ist groß, dass das Label „Generative AI“ rationale Kritik blockiert und unvalidierter Code direkt in Deployments mündet
  • Weder Wissenschaft noch Industrie sind perfekt, doch die Diskussion dürfte weitergehen, weil Data Science nur mit kritischem Denken innerhalb der Community, besserer Ausbildung und mehr Reflexion über die Arbeitskultur im eigentlichen Sinne wieder zu einer Wissenschaft werden kann

2 Kommentare

 
ytuniverse 2025-07-17

Der Link funktioniert nicht.
https://reddit.com/r/datascience/…

 
xguru 2025-07-17

Danke. Ich habe es korrigiert.