- In den letzten Jahren ist die Diskussion über AGI (Artificial General Intelligence, allgemeine künstliche Intelligenz) stark angestiegen
- Die genaue Definition von AGI ist unklar und umstritten, und das Festlegen einer AGI-Timeline ist zu einer gängigen Form der Debatte geworden
- „Lange Timeline“: die Sichtweise, dass AGI in 10–20 Jahren kommen wird
- „Kurze Timeline“: die Behauptung, dass AGI schon bald erscheinen wird
- Doch über die Entwicklung von AI auf diese Weise zu sprechen, ist ineffizient
- Es ist angemessener, sie nicht als Weg zu einem Zielpunkt namens AGI, sondern als Prozess zunehmender Produktivität von AI zu betrachten
- AI entwickelt sich so weiter, dass sie mit immer weniger menschlichem Eingriff immer mehr Aufgaben ausführen kann
- Beispiele: Daten-Labeling, Code schreiben, Mathematikaufgaben lösen, autonomes Fahren, automatisches Fliegen
- Ob AI jemals einen Punkt erreicht, an dem sie dauerhaft ohne menschlichen Eingriff arbeitet, ist jedoch ungewiss
- Wir sollten messen, wie viel Wert AI im Verhältnis zu einem gegebenen Input erzeugen kann
- Der Fortschritt von AI lässt sich als Zunahme des wirtschaftlichen Werts verstehen, den AI im Verhältnis zum menschlichen Aufwand erzeugt
- Die wichtige Frage lautet:
- Kann AI sich unbegrenzt weiterentwickeln und ohne menschlichen Eingriff wirtschaftlichen Wert schaffen?
- Oder stößt sie ab einem bestimmten Punkt an technische Grenzen?
- Falls AI vollständig ohne menschlichen Eingriff wirtschaftlichen Wert erzeugen kann, könnte das sogar ein ziemlich riskantes Ergebnis sein
Wir haben dieses Phänomen bereits gesehen (selbstfahrende Autos)
- In der AI-Branche gab es vor dem Boom der Sprachmodelle, etwa 2017, einen Hype um selbstfahrende Autos
- Damals erklärten mehrere Unternehmen, innerhalb eines Jahres vollautonome Autos (Full Self-Driving, FSD) auf den Markt zu bringen, und zogen Investitionen in Milliardenhöhe an
- Es wurden Millionen Meilen gefahren, viele Firmen gegründet, doch einige gingen am Ende bankrott
- Vollständiges FSD ist noch immer nicht erreicht
- Tesla ist nach wie vor nicht zu vollständig autonomem Fahren in der Lage, und Waymo funktioniert nur teilweise in bestimmten vorab kartierten Gebieten
- Noch immer sind gelegentliche menschliche Eingriffe nötig
> Prognose von Tesla-CEO Elon Musk im Jahr 2016:
> „Noch in diesem Jahr wird ein Tesla vollständig autonom von Los Angeles nach New York fahren.“
> → Doch bis heute, Stand 2024, ist das nicht eingetreten (Tesla verkauft weiterhin die Abo-Option „Full Self-Driving“)
- Heute ist es realistischer, statt darüber zu diskutieren, ob autonomes Fahren vollständig möglich ist, die Kennzahl „miles-per-intervention“ zu messen
- Also: wie weit ein Auto ohne einen einzigen menschlichen Eingriff fahren kann
- Laut aktuellen Berichten benötigt Tesla im Durchschnitt alle 13 Meilen einen menschlichen Eingriff
- Mit größeren AI-Modellen, schnellerer Inferenz, mehr Daten und verbessertem Engineering dürfte dieser Wert steigen
- Ob dieser Wert mit der heutigen Technologie jedoch unbegrenzt wachsen kann, ist unklar
- Mit anderen Worten: Wir wissen noch nicht, ob sich Modelle für autonomes Fahren unbegrenzt verbessern und menschliche Eingriffe vollständig überflüssig machen werden, oder ob sie auf einem gewissen Niveau an Grenzen stoßen
Warum Yann LeCun unrecht hatte (teilweise)
- Yann LeCun, Chief AI Scientist bei Meta, argumentierte in der Vergangenheit, dass Sprachmodelle keine Intelligenz auf menschlichem Niveau erreichen können
- Seine Begründung: Sprachmodelle erzeugen Ausgaben Token für Token; bei jedem Token besteht eine gewisse Fehlerwahrscheinlichkeit, und wenn sich diese Fehler akkumulieren, werde die Leistung am Ende nachlassen
- Er betrachtete dieses Problem der Fehlerakkumulation als fundamentale Grenze von Sprachmodellen und argumentierte, dass man zur Lösung den heutigen autoregressiven Ansatz aufgeben müsse
- Doch die Realität sah anders aus
- Moderne AI-Systeme (OpenAI o1/o3, DeepSeek R1 usw.) widerlegen diese Hypothese frontal
- Sie sind weiterhin autoregressiv, aber ihre Leistung verbessert sich sogar, je längere Ausgaben sie erzeugen
- In der Forschung zu DeepSeek R1 zeigte sich ein Muster, bei dem die Wahrscheinlichkeit korrekter Antworten steigt, je länger das Modell „nachdenkt“
> Ein Blick auf die Grafiken im DeepSeek-R1-Bericht zeigt: Mit längerer Ausgabe steigt die Leistung → ein direkter Widerspruch zu Yann LeCuns Hypothese
- Wie Modelle ihre eigenen Fehler korrigieren
- Die bisherige Logik beruhte auf der Annahme, dass sich Fehler zwangsläufig auf Token-Ebene ansammeln
- Neuere Forschung zeigt jedoch, dass Modelle über Mechanismen zur eigenen Fehlerkorrektur verfügen
- Wenn etwa bestimmte Tokenmuster erzeugt werden, lässt sich beobachten, dass das Modell unterwegs probabilistisch zu besseren Antworten findet
> Beispiel aus DeepSeek R1: der Prozess, in dem das Modell an einem bestimmten Punkt eine „bessere Antwort“ findet → genau das, was Yann LeCun für unmöglich hielt
- Einige Forschende analysieren derzeit diese Selbstkorrektur-Mechanismen (self-correction) und untersuchen, wie sie sich wirksamer auslösen lassen
- Unklar ist allerdings noch, ob dieser Ansatz nur bei bestimmten Problemtypen wie Coding oder Mathematikaufgaben funktioniert
Warum Yann LeCun recht hatte (teilweise)
- Yann LeCuns Hypothese war nicht vollständig falsch
- Auch wenn neuere Forschung seine Hypothese der „Fehlerakkumulation“ widerlegt, bleibt richtig, dass Sprachmodelle keine unbegrenzt präzisen Ausgaben erzeugen können
- Das heißt: AI kann nicht ewig unabhängig arbeiten
- Die Grenzen vollständig autonomer Agenten (FAA)
- Viele Forschende wollen AI-Agenten entwickeln, die über lange Zeiträume Aufgaben ausführen können
- Doch das ist ein ähnliches Problem wie die Entwicklung von Full Self-Driving (FSD)-Autos
- Mit dem aktuellen Technologie-Stack könnten vollständig autonome AI-Systeme also unmöglich sein
- Die Bedeutung menschlicher Eingaben
- Die verlässlichsten Informationen stammen aus Prompts, die Menschen direkt eingeben
- AI kann zwar über einige Tools zusätzliche Daten erhalten (z. B. Flugabfragen, Wetterabfragen usw.), aber nur weil sie sehr lange Ausgaben erzeugt, steigt die Wahrscheinlichkeit einer richtigen Antwort nicht unbegrenzt weiter
- Dass AI ohne menschlichen Eingriff unbegrenzt nützliche Ausgaben erzeugen kann, ist eher unwahrscheinlich
Warum wir AGI-Debatten in der AI-Forschung vermeiden sollten
- Den Fortschritt von Sprachmodellen anhand einer AGI-Timeline zu messen, ist der falsche Ansatz
- Die bessere Frage lautet: „Wie lange kann AI ohne menschlichen Eingriff effektiv arbeiten?“
- So wie man beim autonomen Fahren „miles-per-intervention“ misst, ist es auch bei Sprachmodellen praktischer zu messen, „wie lange sie ohne menschlichen Eingriff korrekte Ausgaben erzeugen können“
- Statt auf eine AI zu warten, die völlig ohne menschlichen Eingriff arbeitet (FAA, Fully Autonomous Agent), ist es wichtiger, den heutigen kontinuierlichen Fortschritt als „Zunahme nützlicher AI-Arbeit“ zu erkennen
- Auch ohne vollständige AGI ist der wirtschaftliche Wert der heutigen Technologie bereits bedeutend
- Daher ist es sinnvoller, statt darüber zu diskutieren, wann AGI erreicht wird, die tatsächliche Produktivität von AI zu verbessern
2 Kommentare
„KI kann niemals für immer unabhängig arbeiten“
Dieser Teil ist beeindruckend.
Hacker-News-Meinung
Satya Nadella spricht über AGI
Es ist wichtig, Wege zu finden, Menschen Arbeit zu geben
Die Skepsis gegenüber dem "Reasoning" von LLMs wächst
Diskussion über autonom fahrende Autos
Überzogene Erwartungen an AGI und humanoide Roboter
Die Erwartungen der Menschen an AGI
Der Erfolg von Language-Diffusion-Modellen
Fragen zum wirtschaftlichen Wert von AI
Vergleich zwischen AI und menschlichen Träumen