3 Punkte von GN⁺ 3 시간 전 | 1 Kommentare | Auf WhatsApp teilen
  • Die Nutzung von generativer KI über Chat-Interfaces ist weniger ein universelles Alltagswerkzeug als vielmehr ein Kontinuum aus intensiver Nutzung, gelegentlicher Nutzung und Nichtnutzung
  • Fasst man verschiedene Nutzungsdaten und Umfragen zusammen, teilt sich die KI-Nutzung in den USA grob in ein Drittel intensive Nutzung, ein Drittel gelegentliche Nutzung und ein Drittel Nichtnutzung
  • Auch bei Gen Z ist das Bewusstsein für KI hoch, doch die Akzeptanz stagniert nahezu; in Gallup-Erhebungen machen Nutzung einmal im Monat oder alle paar Monate sowie Nichtnutzung einen großen Anteil aus
  • Hauptgründe für die begrenzte KI-Nutzung sind Sorgen über Jobverdrängung, Eingriffe in die Privatsphäre, die Verbreitung von Falschinformationen sowie Skepsis gegenüber dem Nutzen von KI
  • KI-Markt und KI-Politik sollten nicht von der Dichotomie „alle nutzen sie“ oder „niemand nutzt sie“ ausgehen, sondern von Menschen mit unterschiedlicher Nutzungsintensität und unterschiedlichen Bedenken

„Alle nutzen KI für alles“ ist in Wirklichkeit näher an „einige nutzen KI für einige Dinge“

  • Mit KI ist hier keine streng definierte Kategorie gemeint, sondern generative KI, die über Chat-Interfaces zugänglich ist
  • Die Annahme „Wer KI einmal ausprobiert, nutzt sie für alles“ und die Annahme „KI wird so gut, dass alle sie nutzen“ passen nicht zu den Daten
  • Gen Z ist die Gruppe mit dem höchsten KI-Bewusstsein, doch die KI-Akzeptanz hat im vergangenen Jahr nahezu stagniert, und ein erheblicher Anteil nutzt KI selten oder überhaupt nicht
  • Die Gen-Z-Zahlen von Gallup für 2025/2026 zeigen, dass sich die KI-Nutzung nicht in Richtung allgemein verbreiteter intensiver Nutzung bewegt hat
    • Der Anteil, der KI wenigstens selten nutzt, liegt bei 79 %/81 %
    • Der Anteil, der sich wegen KI ängstlich fühlt, liegt bei 41 %/42 %
    • Der Anteil, der KI nur einmal im Monat oder alle paar Monate nutzt, liegt bei 32 %/31 %
    • Der Anteil, der wegen KI Wut empfindet, liegt bei 22 %/31 %
    • Der Anteil, der KI überhaupt nicht nutzt, liegt bei 21 %/19 %

Die Verteilung laut tatsächlichen Nutzungsdaten

  • Die Daten zu United States AI Diffusion von Microsoft basieren auf anonymisierten und aggregierten Microsoft-Telemetriedaten und gehen davon aus, dass mehr als 30 % der US-Bevölkerung im erwerbsfähigen Alter KI nutzen
    • Das bedeutet, dass rund 70 % nach diesem Maßstab keine KI-Nutzer sind
    • Das sind 3 Prozentpunkte mehr als Ende 2025
    • Als Nutzung gilt, wenn in großen KI-Diensten wie ChatGPT, Google Gemini, Anthropic Claude oder Microsoft Copilot mindestens 90 Minuten pro Monat verbracht wurden
  • Auch die tatsächlichen Nutzungsdaten von Datos zeigten ein ähnliches Bild: Im Juni vergangenen Jahres besuchten nur 21 % der Desktop-Geräte KI-Tools mehr als 10-mal im Monat
    • 62 % der Desktop-Geräte besuchten KI-Tools überhaupt nicht
    • Die übrigen 17 % lagen dazwischen
  • In einer Umfrage des Searchlight Institute gaben 58 % an, KI wie ChatGPT oder Claude genutzt oder ausprobiert zu haben
    • Der Anteil, der sie relativ regelmäßig nutzt, liegt bei 30 % und verwendet sie einige Male pro Monat oder häufiger
    • Seltenere Nutzer machen 29 % aus und verwenden sie einmal im Monat oder seltener
  • Eine neue Umfrage von The Argument zeigt, dass die meisten Amerikaner KI höchstens einmal pro Woche nutzen

Die KI-Nutzung in den USA ähnelt einer Dreiteilung

  • Fasst man verschiedene Datenquellen zusammen, teilt sich die KI-Nutzung in den USA grob in ein Drittel intensive Nutzung, ein Drittel gelegentliche Nutzung und ein Drittel Nichtnutzung
  • Diese Verteilung kann je nach Begriffsdefinition etwas variieren, liegt aber näher an „einige nutzen KI für einige Dinge“ als an „alle nutzen KI für alles“
  • In den vergangenen 6 bis 12 Monaten hat sich die KI-Nutzung nicht stark verschoben
  • Deutlich verändert haben sich vor allem die negativen Gefühle gegenüber KI; in Gallups Gen-Z-Umfrage stieg die Wut gegenüber KI im Vergleich zum Vorjahr um rund 40 %

Viele begrenzen ihre KI-Nutzung wegen realer Sorgen und geringem wahrgenommenem Wert

  • Ein erheblicher Anteil der Menschen begrenzt die KI-Nutzung aktiv; Hauptgrund sind reale Sorgen über KI
  • In der Searchlight-Umfrage waren die drei größten Sorgen Jobverdrängung und Arbeitslosigkeit, Eingriffe in die Privatsphäre sowie die Verbreitung von Falschinformationen und Lügen
    • „KI wird Arbeitsplätze verdrängen und Arbeitslosigkeit verursachen“: 42 %
    • „KI wird die Privatsphäre der Menschen verletzen“: 35 %
    • „KI wird Falschinformationen und Lügen verbreiten“: 33 %
  • Auch die Präferenz für KI-Regulierung zum Schutz von Sicherheit und Privatsphäre ist stark; die Mehrheit meint, die Regierung solle Sicherheits- und Datenschutzregeln priorisieren, selbst wenn sich dadurch die KI-Entwicklung in den USA gegenüber Ländern wie China verlangsamt
  • Auch die Skepsis gegenüber dem Nutzen von KI ist groß; die Netto-Positivbewertung der gesellschaftlichen Auswirkungen liegt bei KI nur bei +8 %
    • Soziale Medien liegen bei +7 %, Kryptowährungen bei -17 %
    • Mobiltelefone, das Internet und Solarenergie liegen jeweils bei +68 %, +67 % und +65 %
  • Die Umfrage von The Argument zeigte eine weit verbreitete Skepsis gegenüber konkreten gesellschaftlichen Vorteilen von KI; diese Skepsis gegenüber den Wirkungen von KI stammt nicht nur aus Unwissenheit bei Menschen ohne praktische Nutzungserfahrung

Auch für den persönlichen Gebrauch ist der Wert für viele im Verhältnis zu den Sorgen nicht groß genug

  • Auf gesellschaftlicher Ebene kann man KI negativ sehen und sich auf persönlicher Ebene dennoch anders verhalten, doch die aktuelle Verteilung der KI-Nutzung passt nicht zu diesem Bild
  • Dass gelegentliche Nutzer den größten Block bilden und es zugleich viele vollständige Vermeider gibt, zeigt, dass viele bislang keinen persönlichen Nutzen gefunden haben, der ihre Sorgen überwiegt
  • Das Mediennarrativ „Alle nutzen KI für alles“ könnte die Blase früher adaptierender Wissensarbeiter und des Technikjournalismus widerspiegeln
  • Unternehmen, Kommentatoren und politische Entscheidungsträger sollten nicht ignorieren, wie Menschen tatsächlich über KI denken und wie sie sich verhalten
  • KI-Nutzung ist keine Dichotomie aus Nutzung durch alle oder Nichtnutzung durch alle, sondern ein Kontinuum aus gemischten Meinungen und unterschiedlicher Nutzungsintensität

Zentrale Metapher: Fleischkonsum und KI-Konsum

  • KI-Konsum ähnelt dem Fleischkonsum: Es gibt Menschen, die ihn aktiv annehmen, Menschen, die ihn reduzieren, und Menschen, die ihn vollständig vermeiden
  • Die Botschaft, dass Protein wichtig für die Ernährung ist, ähnelt der Botschaft, dass KI für Produktivität nützlich ist; und dass Fleisch eine Hauptquelle für Protein ist, entspricht der Rolle von KI-Chat-Tools als wichtigstem Zugangspunkt zu generativer KI
  • Auch die Präferenzen beim Fleischkonsum in den USA folgen keinem Muster, in dem alle konsumieren
    • 95 % essen Fleisch
    • 70 % geben an, ihren Konsum von rotem Fleisch zu reduzieren
    • 30 % essen jegliches Fleisch selten oder nur gelegentlich
    • 12 % essen kein rotes Fleisch
    • 4 % sind Vegetarier und essen überhaupt kein Fleisch
    • 1 % sind Veganer und konsumieren keinerlei tierische Produkte
  • Gründe für die Einschränkung des Fleischkonsums sind Gesundheit, Kosten, Umwelt und Ethik; das überschneidet sich mit den wichtigsten Sorgen beim KI-Konsum

Marktchancen und Produktoptionen

  • Die Metapher des Fleischkonsums zeigt Marktchancen für Menschen mit unterschiedlichen Einstellungen zu KI und unterschiedlichen konkreten Sorgen
  • DuckDuckGo macht alle KI-Funktionen optional und bietet duck.ai als privaten Chatbot-Ersatz für Datenschutzbedenken an
  • Dieser Ansatz ähnelt eher einem Restaurant mit verschiedenen Wahlmöglichkeiten im Menü, in dem Optionen wie private KI, weniger KI-Nutzung oder das Abschalten von KI nebeneinander bestehen
  • Wer das gesamte Spektrum der KI-Nutzer berücksichtigen will, braucht wählbare Strukturen statt einer einheitlich erzwungenen KI-Nutzung

Mögliche Veränderungen in Zukunft und die Schlussfolgerung für heute

  • Man kann nicht davon ausgehen, dass das etwa eine Drittel, das KI derzeit selten oder nur gelegentlich nutzt, dieses Muster für immer beibehält
  • Anders als Fleisch befindet sich KI in einem technischen Umfeld, das sich schnell verändert; wohin sich Produkte und Regulierung entwickeln, ist daher sehr ungewiss
  • Die Produktentwicklung könnte KI für durchschnittliche Menschen nützlicher machen, und Regulierung könnte Sorgen verringern
  • Nach heutigem Stand hat ein bedeutender Anteil der Menschen die derzeitige KI ausprobiert und sich dann entschieden, ihre Nutzung bewusst stark zu begrenzen

1 Kommentare

 
GN⁺ 3 시간 전
Hacker-News-Kommentare
  • Ich suche gerade nach meinem Masterabschluss einen Job, und in technischen oder Whiteboard-Interviews werde ich meistens gefragt: „Wie nutzen Sie LLMs?
    Die Antwort ist knifflig, weil man nicht weiß, ob das Gegenüber von AI begeistert oder eher vorsichtig ist, und deshalb versucht man, so zu antworten, dass es für beide Seiten sicher passt.
    Deshalb antworte ich meist ausführlich in der Art von: „Es gibt definitiv eine Lernkurve dabei, diese Technologie in einen Prozess einzubauen, und ich validiere die Ergebnisse immer mehrfach.“
    Tatsächlich nutze ich Chat-/Fragefunktionen täglich für schnelles Debugging oder um neue Technologien zu lernen, aber vollständige Agenten oder Computer-Use-Produkte habe ich ein paarmal ausprobiert, mit schlechten Ergebnissen, daher nutze ich sie bisher kaum.
    Ich habe versucht, ein großes, jahrzehntealtes Fortran+C-Repository für moderne Compiler/OS zu refaktorieren; manches funktionierte, aber am Ende habe ich aufgegeben.

    • Vielleicht ist es am besten, einfach ehrlich zu antworten.
      Wenn schon ein falsch gewähltes Wort dazu führt, dass man angeblich hätte Gedanken lesen müssen, will man dort dann überhaupt arbeiten und auch noch Rollenspiele spielen?
      Das wirkt eher wie eine toxische Beziehung als wie ein Arbeitsplatz.
    • Aus Sicht eines Hochschulabsolventen habe ich solche Gespräche lange von beiden Seiten gesehen, und es ist gut, diese Frage als Chance zu nutzen, gegenseitige Passung zu zeigen.
      Ob ein Unternehmen AI mag oder vorsichtig damit ist, ist wichtig, aber ich würde empfehlen, die Frage umzudeuten in: „Passe ich zu dieser Organisation, und passt diese Organisation zu mir?“
      Wenn man knapp zeigen kann, wie man beurteilt, für welche Aufgaben LLMs geeignet sind, und wie man überprüft, ob sie die Ergebnisse tatsächlich verbessert haben, ist das eine starke Antwort.
    • Es ist hilfreich, ein kurzes Beispiel vorzubereiten, bei dem es gut funktioniert hat, und eines, bei dem es nicht gut funktioniert hat.
      Das signalisiert, dass man selbst exploriert hat und genug darüber nachgedacht hat, um interessante Beobachtungen zu erklären, und man kann sich darauf vorbereiten, tiefer einzusteigen, falls Interesse besteht.
    • Trotzdem ist das meiner Meinung nach zehnmal besser als: „Lösen Sie in 20 Minuten eine LeetCode-Variante eines Algorithmus und erklären Sie dabei Ihren Denkprozess; wir nutzen das zwar nicht in der Praxis, wollen aber sehen, ob Sie in den letzten Monaten Zeit hatten, kurzfristig ein Algorithmenbuch durchzuarbeiten.“
    • Ich verstehe den Druck bei der Jobsuche, aber Meinungsunterschiede sollte man ruhig zeigen, und normalerweise sind sie kein Grund, dass ein Unternehmen jemanden ablehnt.
      Engineering-Leads suchen oft gezielt nach Leuten mit unterschiedlichem Hintergrund und unterschiedlichen Perspektiven für dasselbe Team.
      Wenn man ehrlich antwortet, kann man sogar eher auffallen als Bewerber, die eine offensichtliche und übertrieben defensive Standardantwort geben.
  • Die Aussage „AI wird so gut, dass sie trotz Unbehagen am Ende alle nutzen“ ist meiner Erfahrung nach von Fall zu Fall unterschiedlich.
    Dieser Kommentar[0], den ich gestern geschrieben habe, zeigt gut, wie ich LLMs in meine aktuelle Arbeit integriere.
    Ich habe sie im Projekt für Backend (PHP) und Frontend (Swift) eingesetzt, und in beiden Fällen haben sie stark geholfen, aber bei Swift war es eher ein warnendes Beispiel.
    Bei der Entwicklung nativer UIKit-Swift-Apps brauchte es wirklich Aufsicht durch einen Erwachsenen, und mir wird gerade klar, wie schlecht der generierte Code war.
    Bei PHP hingegen wurden vernünftige Architekturentscheidungen getroffen, und ich bekam Code, der besser war als der, den ich selbst geschrieben hätte.
    Auf der Swift-Seite geriet es bei realen Problemen in Panik wie ein unerfahrener Engineer, und der Code, den ich nun neu schreibe, wird einen viel einfacheren und robusteren Ansatz verfolgen.
    Insgesamt war es trotzdem ein klar positiver Produktivitätsgewinn, und ich habe gelernt, dass es gut darin ist, Probleme zu finden, aber weniger gut darin, sie zu beheben.
    [0] https://news.ycombinator.com/item?id=48515217

    • Inzwischen gibt es fast keinen Weg mehr, AI zu entkommen.
      Wenn man im Internet nach irgendetwas sucht, ist die Wahrscheinlichkeit sehr hoch, dass mehrere Seiten mit AI-generierten Inhalten auftauchen.
      Deshalb ist es heute oft besser, selbst direkt einen Prompt einzugeben und eine Antwort zu bekommen.
      Nicht weil die Antwort selbst großartig wäre, sondern weil ich den Prompt kontrollieren kann statt eines indirekten Prompts über die Suche.
      Es ist traurig zu sehen, wie hochwertiger Content in einem Meer aus Müll untergeht und fast nicht mehr auffindbar ist.
    • Das ist ein erwartbares Ergebnis.
      Bei PHP sind die Corner Cases, auf die Menschen über Jahrzehnte gestoßen sind, seit Langem im Internet dokumentiert, während Swift relativ neu ist und es weniger Material gibt.
      Wenn man die Fähigkeiten von AI als auf das 10- bis 20-Fache komprimierte Dauer einer Engineering-Karriere betrachtet, wird es etwas verständlicher.
      Bei neuen oder Nischenthemen wird sie intuitiv schwächer sein, und künftig könnte es noch schlimmer werden, wenn sie den Müll lernt, den andere LLMs ausgespuckt haben.
    • Es gibt nicht nur diese eine Art, LLMs zu nutzen.
      Neulich im Flugzeug wollte ich die Ohrhörer meiner Frau mit dem MacBook verbinden, war aber an das alte AirPods-Pro-Case gewöhnt und fand den Pairing-Modus nicht.
      Also fragte ich offline in LM Studio Gemma4 26B A4B, und es sagte mir, ich solle zweimal auf die Vorderseite des Cases tippen; das funktionierte tatsächlich.
      In so einer Situation wäre es ohne ein lokales LLM viel nerviger gewesen.
      Es mag ungenau sein, aber es ist immer noch besser als nichts, gewissermaßen das gesamte grundlegende „Wie mache ich das?“-Wissen ständig dabeizuhaben.
    • Für PHP-Code gibt es viel mehr Material, das man wiederkäuen kann, und Swift-Apps sind wahrscheinlich oft proprietärer Code.
      Das Problem ist, dass LLMs nicht nach Prinzipien programmieren, sondern auf Muster aus den Trainingsdaten matchen.
    • Bei XY-Problemen scheint AI immer wieder zu scheitern.
      Genau das war auch der Punkt, den die Leute bei Stack Overflow so sehr gehasst haben.
  • Der Artikel ist gut, aber es fehlt eine Perspektive.
    Im Text wird eine Studie zitiert, die zeigt, wie oft Menschen sagen, dass sie „AI nutzen“, und etwas mehr als die Hälfte nutzt sie weniger als einmal pro Woche.
    Wenn nur Chat-Interfaces für AI gemeint sind, kann das stimmen.
    Wahrscheinlicher ist aber, dass die zunehmende Nutzung von AI weniger über mehr Chat-Interaktion läuft, sondern über in Software eingebettete AI-Funktionen, die Menschen ohnehin schon verwenden.
    Wenn man dieselben Leute zum Beispiel fragen würde: „Wie oft nutzen Sie die Google-Suche?“, läge die Zahl viel höher.
    Diese Menschen nutzen im eigentlichen Sinn AI, sie nehmen es nur nicht so wahr, weil die Funktion eingebettet ist.

    • Diese Logik passt meiner Meinung nach nicht besonders gut zu der konkreten Frage, die der Artikel beantworten will.
      Eine solche Form der AI-Einführung ist erzwungene Adoption und läuft in vielen Fällen den Nutzerpräferenzen zuwider.
      Entscheidend ist, ob man wissen will, ob Menschen an AI interessiert sind und sie als nützlich empfinden, oder ob man eher eine Frage stellt, die in Richtung „X % der Menschen nehmen über Lebensmittel Blei auf“ geht.
  • Das Verkaufsversprechen lautete: „Wenn du es nicht einführst, wirst du abgehängt“, und ich warte immer noch darauf.
    Ein paar Jahre sind vergangen, aber mein Alltag hat sich nicht verändert, und Leuten, die früher keine Handbücher gelesen haben, bringe ich jetzt bei, stattdessen einen Chatbot zu fragen.
    Was soll man mit deren Defiziten anfangen, wenn schon mein „fehlender Zierrat“ angeblich das Problem sein soll?

  • Ich sehe, wie mehrere Unternehmen in Support-Abläufen deterministische Systeme durch langsamere und schlechtere LLM-Versionen ersetzen.
    Viele Interfaces werden nicht besser, nur weil man AI dranhängt.

    • Das wirklich Beste ist, sich von einem LLM beim Erstellen deterministischer Systeme helfen zu lassen.
      Statt das LLM direkt Aufgaben ausführen zu lassen, die sich offensichtlich wiederholen werden, ist es besser, es ein Programm oder Python-Skript schreiben zu lassen, das diese Aufgaben erledigt.
    • Ähnliches sehe ich auch bei allgemeinen Tools und in der Entwicklung.
      Dinge, die sich deterministisch lösen lassen oder die vor 5 Jahren noch ein einfaches Kommandozeilen-Tool gewesen wären, werden jetzt zu einer LLM-Integration.
      Statt mit LLMs deterministische Tools zu bauen, ersetzt man diese Tools durch LLMs.
      Das ist völlig verkehrt herum, und ich verstehe besonders bei den höhergestellten Leuten in unserem Unternehmen nicht, warum sie das für die Zukunft halten.
      Ich will keine komplette CI-Pipeline, die nur aus LLM-Prompts besteht.
      Das ist zwar leicht zu bauen, aber teuer und langsam und scheitert leicht auf unvorhersehbare Weise.
      Beim Code Review ist es genauso: Was mit einer einfachen Linting-Regel erledigt wäre, wird zu einer LLM-Prüfstufe.
      Dabei sind LLMs wirklich hervorragend darin, genau solche Linting-Regeln zu erstellen.
    • Unser Management setzt uns unter Druck, Ideen zu liefern, wo man LLMs im Produkt einsetzen könnte.
      Das ganze Team wehrt sich genau aus diesem Grund stark dagegen.
      Fast alles, was uns einfällt, macht es nur schlechter, und wir haben bereits gehört, dass selbst eine Überschuss-Fehlerrate von 1–2 % nicht akzeptabel ist.
      Um dieses Niveau zu erreichen, braucht es mehr Struktur und Standards, nicht weniger.
    • Im Moment scheint es, als würden die Leute diesen Artikel[1] nicht als Warnung, sondern als Ziel auffassen.
      [1] https://thedailywtf.com/articles/Classic-WTF-No-Quack
    • Der Grund, warum man in Support-Abläufen deterministische Systeme ersetzt, ist nicht, dass man besseren Support bieten will, sondern dass man billigeren Support will.
      Man kann sich geschulte Berater vorstellen, die das große Ganze verstehen, und sich vorstellen, dass ein Unternehmen darin investiert, Menschen mit AI Wissen durchsuchen und Relevanz beurteilen zu lassen, damit sie Kunden besser helfen können.
      Aber AI wird derzeit als „Support-Personal ist nicht nötig“ verkauft, nicht als „Wie können wir besseren Service bieten?“.
      Bei vielen Produkten bedeutet besserer Service nicht besonders viel, und das billigere Produkt wird am Ende meist gewinnen.
      Die Leute wollen nicht mehr für etwas Besseres bezahlen, sondern etwas Besseres zum gleichen Preis.
      Deshalb scheint es, als würden Unternehmen keine Zeit darin investieren, herauszufinden, wie man AI richtig einsetzt.
  • Ich denke, der Grund für die Lücke ist erstens, dass Claude beim Programmieren erstaunlich gut ist.
    Der Hauptgrund dafür sind kuratierte Technik und gewaltige Mengen funktionierenden Codes, der über GitHub in den letzten gut zehn Jahren sorgfältig gelabelt wurde.
    Außerdem ist die Bandbreite dessen, was man in einer Turing-vollständigen Sprache tun kann, in gewissem Maß begrenzt.
    Zweitens sind LLMs bei den meisten anderen Tätigkeiten ziemlich enttäuschend.
    Research ist meist eher durchschnittlich.
    Wenn man das streng betrachten will, kann man denselben Research-Prompt mehrfach wiederholen, eine Konfusionsmatrix erstellen und zählen, wie viele False Positives und False Negatives dabei herauskommen.
    Auch bei den übrigen Anwendungsfällen sollte man sich ehrlich fragen, ob sie wirklich viel mehr leisten als eine einfache Suchmaschinenanfrage oder ein Besuch bei Wikipedia.
    Für allgemeine Nutzeranwendungen ist es einigermaßen praktisch, aber von revolutionär noch weit entfernt.

    • Das liegt auch daran, dass Programmierung innerhalb des Computers in sich geschlossen ist und sich Ergebnisse leicht testen und iterieren lassen.
      Beim Programmieren kann der Agent den Compiler und die Tests ausführen und es erneut versuchen, bis es klappt.
      Wenn man zum Beispiel ein T-Shirt nähen möchte, ist AI dagegen nutzlos.
    • Den Teil über Turing-vollständige Sprachen habe ich nicht verstanden; ich würde mich freuen, wenn du diesen Punkt erklären könntest.
  • Man muss auch berücksichtigen, wie viele Erwachsene in den USA inzwischen faktisch nur unzureichend lesen und schreiben können
    Stand 2023 lagen 27 % der US-Erwachsenen im erwerbsfähigen Alter im PIAAC-Leseverständnis auf Stufe 1 oder darunter von 5 Stufen
    2013 waren es 17 % auf Stufe 1 oder darunter, also hat es sich in den letzten 10 Jahren deutlich verschlechtert
    Die Gesamtverteilung 2023 war: 27 % auf Stufe 1 oder darunter, 29 % auf Stufe 2, 31 % auf Stufe 3 und 13 % auf Stufe 4/5
    Zur Einordnung: Auf Stufe 1 ist es schon schwierig, überhaupt mit einer Seite Text richtig umzugehen, und man kann vielleicht eine einfache einseitige Webseite einigermaßen bewältigen
    Erst auf Stufe 2 kann man einige Seiten einfachen Texts verarbeiten, aber komplexere Inhalte bleiben weiterhin schwierig
    Menschen, die AI gar nicht benutzen, tun das oft deshalb, weil sie sie grundsätzlich nicht nutzen können
    Quelle: https://nces.ed.gov/surveys/piaac/2023/national_results.asp

    • Diese Stufen waren anders, als ich erwartet hatte
      https://nces.ed.gov/surveys/piaac/measure.asp?section=1⊂_...
      Ich halte mich selbst eindeutig für literat, aber ich frage mich, wie gut ich bei Aufgaben auf Stufe 4/5 abschneiden würde
      Ich habe mich auch gefragt, ob sich das mit breiteren Maßstäben überschneidet, etwa Gedächtnis, Intelligenz oder Lerngewohnheiten, bei denen selbst Menschen mit gewöhnlicher „Lese- und Schreibkompetenz“ schlecht abschneiden können
      Nach der Beschreibung wirkt es wie ein Test, der sich gut auf AI anwenden ließe, und ich würde gern Kompetenzwerte verschiedener Modelle sehen
      Als ich später weiter nach unten scrollte, gab es im letzten Abschnitt Beispielaufgaben bis Stufe 4, und selbst die Aufgaben auf Stufe 4 wirkten trivial
      Sogar der ausführlichste Q-Drum-Artikel hatte als Kritikpunkte nur flaches Gelände und Kosten, und wenn man LifeStraw kennt, kann man die ähnliche Kritik in der E-Mail fast schon erraten
      Als ich die Punktzahlen und Kompetenzbeschreibungen sah, nahm ich wegen einer Art Normalverteilung an, dass Stufe 4/5 wirklich schwierig sein müsse, aber nachdem ich die tatsächlichen Aufgaben gesehen habe, macht mich die niedrige Punktzahl eher traurig
      Trotzdem fand ich es lustig, dass jede Prüfungsaufgabe als „Stimulus“ bezeichnet wird; das klingt so steril und klinisch
    • Ich glaube nicht, dass das der Grund ist
      AI-Apps auf dem Smartphone unterstützen Sprachunterhaltungen
      Geringe Lesekompetenz könnte eher ein Anreiz sein, AI Texte erzeugen und zusammenfassen zu lassen
    • Es gibt den Hinweis: „Die Rücklaufquote dieser Datenerhebung war sowohl in den Vereinigten Staaten als auch in einigen anderen teilnehmenden Ländern relativ niedrig. Es gibt zwar Hinweise darauf, dass die Verfahren zur Verringerung von Nonresponse-Bias wirksam waren und die Daten die Bevölkerung repräsentieren, aber Leser sollten sich möglicher Verzerrungen bewusst sein und bei der Interpretation der PIAAC-Ergebnisse Vorsicht walten lassen“
      Diese Statistik fühlt sich intuitiv nicht richtig an
      Etwa ein Drittel der US-Bevölkerung hat einen Bachelor-Abschluss, daher wirkt es seltsam, dass nur 13 % Aufgaben auf Leseverständnis-Stufe 4/5 bestehen können
      Die Beispielaufgaben sehen nicht schwierig aus, und selbst die Aufgaben auf Stufe 4 bestehen nur darin, einen kurzen Text zu lesen und Kritikpunkte zu einem Produkt herauszuarbeiten
      Das heißt nicht, dass alle Menschen mit Bachelor-Abschluss klug sind, aber dass zwei Drittel von ihnen Stufe 4/5 nicht bestehen würden, ist schwer zu glauben
      Wenn 13 % einen Master-Abschluss haben, soll das dann heißen, dass genau diese 13 % Stufe 4/5 bestehen?
      https://en.wikipedia.org/wiki/Educational_attainment_in_the_...
    • Ich lurke im Lehrer-Subreddit und sehe mir auf TikTok auch Videos von Lehrkräften an, und in dieser Algorithmusblase habe ich den Eindruck, dass Kinder inzwischen einfach nicht mehr lesen können
      Vor allem hört man oft, dass das Textverständnis katastrophal ist, und es gibt viele Beispiele von Kindern, die nach dem Lesen einiger Absätze Fragen zum Inhalt nicht beantworten können
  • Ich fürchte, dass AI überall eingesetzt wird, nicht weil sie die beste Lösung ist, sondern weil Menschen im Grunde faul sind, die Arbeit einfach nur hinter sich bringen wollen und sich um Qualität nicht besonders kümmern
    wenig Aufwand und Bequemlichkeit“ scheinen „höchste Qualität“ zuverlässig zu schlagen, und das wird alles für alle herunterstufen

    • Unternehmen senken schon seit Jahren die Qualität ihrer Ergebnisse, und man sieht die Verslopung von allem
      Wenn man Windows 11 mit 98 vergleicht, macht 11 zwar mehr und stürzt seltener ab
      Aber ist es darüber hinaus tatsächlich besser? Was von dem, was beide tun, macht welches besser? Welches ist schneller? Welches ist einfacher zu benutzen?
    • Für viele Menschen werden LLMs bei den meisten Wissensarbeiten wahrscheinlich Ergebnisse liefern, die qualitativ besser sind als das, was sie allein schaffen würden
      Das finde ich in dem Ausmaß okay
  • Ich persönlich wünschte, es würde mehr darüber gesprochen, was genau „AI benutzen“ eigentlich bedeutet
    Mich interessiert auch, wie das mit den übergeordneten Vorstellungen zusammenhängt, die Menschen von „Technologie“, „AI“ sowie „Moral und Emotion“ haben
    Zumindest für mich beginnt die Grenze etwas unscharf zu werden
    Wenn mein Partner zum Beispiel den ganzen Tag häufig Google.com benutzt und fast jedes Mal die KI-generierte Zusammenfassung ganz oben auf der Suchergebnisseite auswählt und ihr vertraut, sollte man dann praktisch sagen, dass er „AI benutzt“?
    Oder ist „AI benutzen“ eher so etwas wie diese vampirartigen Kids aus SF, die am Boden ihrer Matratze 1000 Subagenten laufen lassen?
    Inzwischen steckt schon in der normalen Handynutzung so viel AI, dass ich das ganze Spektrum ziemlich interessant finde, egal ob wir es so nennen oder nicht

  • Die Analogie „Menschen konsumieren AI so, wie sie Fleisch essen. Manche akzeptieren es, manche begrenzen die Nutzung, manche vermeiden es vollständig“ finde ich interessant
    Denn obwohl es reale ökologische Probleme und grundsätzliche Argumente gegen Fleischessen gibt, ist der Fleischkonsum in vielen Ländern weltweit über Jahrzehnte hinweg im Großen und Ganzen gestiegen

    • Vielleicht liegt es daran, dass ich in Wyoming lebe, aber die Behauptung „AI ist nicht universell, und es gibt Leute, die sie wie Vegetarier meiden“ klingt auf mich nicht besonders überzeugend