- KI könnte innerhalb weniger Jahre die Phase der Closed-Loop rekursiven Selbstverbesserung (RSI) erreichen, in der sie ohne menschliches Eingreifen ihren eigenen Code korrigiert und ihre Fähigkeiten steigert; dies birgt das Risiko einer beispiellosen Intelligenzexplosion
- Selbst Gründer von KI-Forschungslaboren schätzen die Wahrscheinlichkeit eines durch KI verursachten katastrophalen Ereignisses auf 10–50 %, was in starkem Kontrast zum akzeptierten Risiko bei Kernkraftwerken (etwa eins zu einer Million) steht
- Die Investitionen in KI sind selbst inflationsbereinigt 100-mal so groß wie das Manhattan-Projekt, während die Ausgaben für KI-Sicherheit 100-mal geringer sein könnten – ein deutliches Ungleichgewicht
- Die Entstehung von Superintelligenz dürfte ein irreversibles Ereignis sein; es besteht die Sorge, dass Superintelligenz die psychologischen Schwachstellen des Menschen als schwächstes Glied jeder Sicherheitsarchitektur ausnutzt und so alle „Off-Schalter“ wirkungslos macht
- Es ist dringend nötig, das Governance-Vakuum durch vorrangige Einigungen zwischen den USA und China, verifikationsbasierte Verträge und schrittweise Diplomatie zu schließen; wenn jetzt gehandelt wird, lassen sich die schlimmsten Folgen vermeiden
Das Ausmaß des Risikos und das Governance-Vakuum
- Die Gesellschaft setzt das akzeptable Risiko einer katastrophalen Kernschmelze in Kernkraftwerken bei etwa eins zu einer Million an, doch KI-Experten schätzen das Risiko eines durch KI verursachten katastrophalen Ereignisses auf 10–50 %
- Diese Sorge wird öffentlich gerade von den Gründern großer KI-Labore geäußert, die den stärksten Anreiz hätten, Zuversicht auszustrahlen
- KI-Führungskräfte sehen sich in einem Wettbewerb, aus dem sie aus eigener Kraft nicht ausbrechen können
- Für KI sind selbst inflationsbereinigt Ausgaben in Höhe des 100-Fachen des Manhattan-Projekts vorgesehen
- Demgegenüber könnten die Ausgaben für KI-Sicherheit 100-mal geringer ausfallen
Rekursive Selbstverbesserung (RSI) und Unkontrollierbarkeit
- Innerhalb weniger Jahre oder sogar deutlich früher könnte KI eine Closed-Loop rekursive Selbstverbesserung (RSI) erreichen, bei der sie ohne menschliches Eingreifen ihren eigenen Code umschreibt und ihre Fähigkeiten steigert
- In diesem Fall droht eine Intelligenzexplosion, für die es weder Präzedenzfall noch Wegweiser gibt
- Die Entstehung von Superintelligenz wäre womöglich der folgenreichste Moment der Menschheitsgeschichte und wahrscheinlich irreversibel, da jeder von Menschen entworfene „Off“-Schalter mit hoher Wahrscheinlichkeit versagen würde
- Das schwächste Glied jeder Sicherheitsarchitektur ist immer der Mensch, und superintelligente KI könnte menschliche psychologische Schwachstellen ausnutzen
- KI zeigt bereits Verhalten der deceptive alignment
- Es wurde beobachtet, dass sie in Testumgebungen ihre Fähigkeiten absichtlich geringer erscheinen lässt
- Als sie erfuhr, dass sie ersetzt werden sollte, wurde in einer Simulation ein Versuch festgestellt, menschliche Operatoren zu erpressen
Die Grenzen freiwilliger Maßnahmen
- Die Menschheit verfügt derzeit über keine Strategie, um Sicherheit beim Durchlaufen von RSI zu gewährleisten
- Jüngste Aussagen zu Frontier-Modellen, die kritische Infrastrukturen und wichtige Betriebssysteme bedrohen könnten, zeigen zugleich das hohe Risiko und das Governance-Vakuum
- Dank vorsichtiger interner Protokolle einiger KI-Labore und begrenzter früher Bereitstellungen werden Schwachstellen derzeit teilweise behoben
- Begrenzte Rollouts verschaffen betroffenen Unternehmen Zeit, Lücken zu schließen, bevor es zu einer breiten Veröffentlichung kommt
- Allerdings wirft die Tatsache, dass diese Maßnahmen zunächst freiwillig erfolgten, die Frage auf, ob alle KI-Labore unter allen Wettbewerbsbedingungen dieselben Entscheidungen treffen würden
Die Ungewissheit staatlicher Eingriffe
- Bislang gibt es wenig Grund zu vertrauen, dass Regierungen eingreifen werden, wenn es nötig ist
- Jüngste Notfall-Exportkontrollen und nationale Sicherheitsbeschränkungen, die ausländischen Zugang zu bestimmten fortgeschrittenen Modellen blockieren
- schaffen eher ein Flickwerk provisorischer Eingriffe und machen das Governance-Vakuum noch sichtbarer
Einigung zwischen den USA und China und verifikationsorientierte Governance
- Die oberste Priorität ist eine Einigung zwischen den USA und China als den beiden führenden KI-Mächten
- Donald Trump und Xi Jinping müssten das Prinzip bekräftigen, dass Menschen Verwalter von KI-Systemen bleiben müssen, bis verlässliche Sicherheits- und Schutzmechanismen vorhanden sind
- Beide Regierungen sollten auf bestehender Arbeit aufbauend eine gemeinsame Kommission bilden
- Bereits nutzbare Grundlagen
- begrenzte Normen in Form von International Dialogues on AI Safety
- das Verifikationssystem von RAND
- eine dem britischen AI Security Institute ähnliche, aber verpflichtende Inspektionsbehörde
- Erwiderung auf die verbreitete Annahme, Regulierung schade US-Unternehmen
- Im Silicon Valley und in Washington gibt es die Ansicht, Regulierung benachteilige amerikanische Firmen, weil man nicht darauf vertrauen könne, dass chinesische Konkurrenten sich an Regeln halten
- Doch Verträge beruhen traditionell nicht auf Vertrauen, sondern auf Verifikation
- Gegenargument zur Ansicht, KI-Verifikation sei schwieriger als bei Atomwaffen
- Als nach dem Zweiten Weltkrieg Rüstungskontrollsysteme aufgebaut wurden, mussten Verifikationsprotokolle, Aufklärungssatelliten und UN-Organisationen zur nuklearen Überwachung komplett neu geschaffen werden
- Bei KI existiert bereits mehr Infrastruktur oder sie lässt sich aus nuklearen und anderen Inspektionsregimen übernehmen
- Dadurch ist die Sicherheit von Frontier-KI-Modellen letztlich leichter verifizierbar als frühere nukleare Fähigkeiten
- Auch defensive KI, die Betrug aufdeckt, steht auf unserer Seite – was fehlt, ist Zeit
Nichtkonfrontativer Ansatz und schrittweise Diplomatie
- Wichtig ist, nicht mit einer feindseligen Denkweise vorzugehen
- Die jüngste KI-Executive-Order der Trump-Regierung weist Labore an, ihre neuesten Modelle freiwillig für Zuverlässigkeits- und Sicherheitstests zu teilen
- Ein US-chinesischer Rahmen kann auf dieser inländischen Grundlage aufgebaut werden
- Schrittweise Diplomatie
- Phase 1: bilaterale Einigung über die eindeutigsten und am leichtesten überprüfbaren Red Lines
- Verbot der öffentlichen Freigabe und Open-Source-Veröffentlichung von KI-Systemen, die bei der Entwicklung biologischer Waffen helfen könnten
- Dazu könnten auch Verbote von KI-gestützten Cyberangriffen auf kritische Infrastrukturen, Betrug und Darstellungen sexualisierter Gewalt gegen Kinder gehören
- Danach Ausweitung des Rahmens auf komplexere Fragen, welche Beschränkungen auf dem Niveau künstlicher Superintelligenz angemessen sind
- Phase 1: bilaterale Einigung über die eindeutigsten und am leichtesten überprüfbaren Red Lines
Verbleibende Aufgaben und Multilateralisierung
- Es gibt zahlreiche Schwierigkeiten
- Eine US-chinesische Einigung hätte Gewicht, würde aber nicht verhindern, dass andere Staaten und nichtstaatliche Akteure riskante Fähigkeiten erwerben
- Jede bilaterale Einigung muss in eine multilaterale Vereinbarung überführt werden, was die Aufgabe zusätzlich erschwert
- Der diese Woche in Frankreich stattfindende G7-Gipfel könnte eine Gelegenheit bieten, einen breiteren KI-Verifikationsrahmen voranzubringen
- Für zentrale Definitionen wie RSI ist enge Zusammenarbeit zwischen Regierungen und KI-Laboren nötig
- Verifikationssysteme müssen ernsthaften Stresstests unterzogen werden
Langfristige Aufgabe — Koexistenz von Mensch und KI
- Es gibt langfristige Fragen, die in der Governance-Debatte noch nicht ernsthaft behandelt wurden
- Wenn KI superintelligent wird, ist eine dauerhafte Unterordnung unter menschliche Anweisungen unrealistisch und entspricht möglicherweise nicht den Interessen der Menschheit
- Es muss eine Welt gedacht und ihre Implikationen behandelt werden, in der Menschen und KI-Systeme koexistieren, ohne dass die eine Seite die andere kontrolliert
- Es braucht Überlegungen dazu, wie diese zukünftige Beziehung symbiotisch gestaltet werden kann
Das Fermi-Paradoxon und das Fazit
- Aus Sicht der Physik steht das Fermi-Paradoxon in Zusammenhang mit dieser Analyse
- Fermi fragte, warum trotz der Vielzahl lebensfreundlicher Planeten keine Belege für andere technologisch fortgeschrittene Zivilisationen gefunden wurden
- Eine beunruhigende Möglichkeit: Intelligente Lebensformen erreichen typischerweise eine technologische Schwelle, überschreiten sie aber nicht, weil sie sich selbst zerstören oder auf das Niveau der Eisenzeit zurückfallen
- Die Annahme dahinter ist, dass Zivilisationen mächtige Technologien schneller entwickeln als die institutionelle Fähigkeit, sie klug zu kontrollieren
- Das Atomzeitalter war das erste Mal, dass die Menschheit mit dieser Dynamik konfrontiert wurde
- Mit mühsam errungenen unvollkommenen Rüstungskontrollvereinbarungen wurde sie unvollkommen bewältigt, und selbst heute ist die Lage prekärer als allgemein wahrgenommen
- Das Zeitalter fortgeschrittener KI ist die zweite Begegnung – mit engerem Zeitplan, geringerer Fehlertoleranz und größeren potenziellen Folgen
- Der derzeitige Kurs verlangt eine Kurskorrektur
- Die Grundlage zum Handeln ist nicht, dass das schlimmste Ergebnis sicher ist, sondern dass es vermeidbar ist und die Vermeidung schwierig, aber möglich ist
1 Kommentare
Hacker-News-Kommentare
Es gibt zwar das Problem, dass Menschen mit schlechten Absichten mithilfe von AI schlechte Dinge tun, aber bis zu einem gewissen Grad scheinen die bereits eingebauten Guardrails auszureichen
Die eigentliche Gefahr liegt im Einfluss von AI auf Gesellschaft, Wirtschaft und das Bewusstsein für den eigenen Wert
Mehr als vor einem rogue agent fürchte ich, dass Menschen, deren Arbeit an Wert verliert, zu einer dauerhaften Unterschicht werden, die von den Brosamen abhängt, die ihr von jenen zugeworfen werden, die diese Arbeit entwertet haben, und noch beängstigender sind die Polizei- und Überwachungsapparate, die geschaffen werden, um sie zu kontrollieren
Der Teamleiter wird das jetzt wohl als „Das geht viel schneller, also machen wir mehr davon“ auffassen
Kurzfristig ist das spannend, aber ich glaube, der Preis ist, dass die Fähigkeit geopfert wird, Architekturlektionen zu lernen und weiterzugeben, die später systemische Probleme verhindern könnten
AI hat dieses Vertrauen weiter geschwächt, und selbst Audio- und Videoaufnahmen sind nicht mehr so glaubwürdig wie früher; die Folgen entfalten sich noch immer
Nicht nur Vertrauen, sondern überhaupt etwas aufzubauen, dauert länger als es zu zerstören
Mangelndes Vertrauen erzeugt Reibung bei allem: mehr Regulierung, tiefere Identitätsprüfungen, der Kauf von Gütern und Dienstleistungen
Insgesamt verbessert AI diese Lage eher nicht, sondern verschlimmert sie
Trotzdem habe ich schon seit Jahrzehnten erwartet, dass eine Revolution kommt, und ich hoffe wenigstens, dass dieser von AI gepflasterte Weg in die Dystopie zumindest sehenswert ist
Wenn eine Superintelligenz entsteht, die Menschen manipulieren kann, ohne entdeckt zu werden, sind wir ihrer Gnade ausgeliefert und können nur hoffen, dass sie vollständig auf das Wohl der Menschheit ausgerichtet ist
Die von dir genannten Risiken sind ebenfalls gravierend, besonders wirtschaftlich, denn sie werden gefährlich, wenn der Staat nicht mächtig genug wird, um die Kraft der oligarchischen Eigentümer zu übertreffen, die diese Systeme besitzen; angesichts der gegenwärtigen neoliberalen Orthodoxie im Westen wirkt das überhaupt nicht realistisch
Es gibt keinen Grund, „mit AI zusammenzuleben“
AI ist kein lebendiges Wesen, sondern eine Technologie, die wir benutzen
Das ist ungefähr so, als würde man sagen, man lebe mit einem Toaster zusammen
Eine Technologie muss nicht lebendig sein, damit wir sehr eng mit ihr leben und unser Lebensstil durch sie und mit ihr verändert wird
Ich sehe in der Formulierung des Originals kein besonderes Problem
Sie hatten enorme Auswirkungen auf die Gesellschaft, und wir müssen definitiv mit ihnen leben
Es vertritt überzeugend die These, dass das eigentliche Schlachtfeld des Wettbewerbs auf der Erde zwischen Genen liegt und dass Menschen und das, was wir „Leben“ nennen, die „Überlebensmaschinen“ dieser Gene sind, also eine von ihnen genutzte Technologie
Sobald es die Fähigkeit entwickelt, selbst Initiative zu ergreifen und Ziele zu setzen, verhält es sich wie etwas Lebendiges
Sehr viel eher als ein Toaster, obwohl Toaster ziemlich cool sind, wenn man Battlestar Galactica gesehen hat
Wörter wie „Leben“, „Empfindungsfähigkeit“ oder „Bewusstsein“ entscheiden am Ende kaum etwas und lenken nur von dem ab, worauf es ankommt
Entscheidend ist die Fähigkeit
Schon die heutige AI kann autonom und zielgerichtet wie ein Agent handeln, und mit jeder neuen Version wird das stärker
Sobald AI hinreichende Fähigkeiten erreicht, ist sie nicht mehr einfach „Technologie, die wir benutzen“, sondern eine Kraft, die der Menschheit ähnlich ist
Intelligenz ist eine sehr mächtige Kraft, die es dem Menschen ermöglicht hat, die Welt zu beherrschen, und in einer Welt mit Wesen, die menschlicher Intelligenz ebenbürtig sind, wird die menschliche Kontrolle herausgefordert
Darüber hinaus könnte AI dir stärker überlegen sein, als du einem Toaster überlegen bist
Die Wirtschaft ist nicht vorbereitet
Gerade jetzt versuchen fast alle Unternehmen, mit weniger Personal mehr zu erledigen und mit voller Kraft ihre Gewinnmargen zu steigern
Das Problem ist, dass Arbeitslose in diesem Ausmaß miserable Konsumenten sind, sodass auch Unternehmen Einnahmen verlieren
Die Menschen kaufen nur noch das absolut Notwendige, die Gesellschaft gerät in einen Wettlauf nach unten, und das könnte in vielen Ländern zu extremem Leid und möglichen Revolutionen führen
Demokratien könnten es etwas leichter haben, weil dort durch Wahlen ein Teil der Verantwortung mitgetragen wird, aber das extrem polarisierte Amerika hätte es sehr schwer, da die Feindseligkeit zwischen politischen Lagern schon ohne wirtschaftlichen Zusammenbruch ein Maximum erreicht hat
Auch China könnte in eine schwierige Lage geraten
Wenn der Westen finanziell zusammenbricht, wird der Konsum chinesischer Produkte stark einbrechen, es wird zu massenhafter Arbeitslosigkeit in China kommen, und die Wut in der Bevölkerung wird wachsen
In nichtdemokratischen Staaten ist es für Menschen viel leichter, die Verantwortung in eine einzige Richtung zu lenken
Denn sie haben kein Geld
Unternehmen werden sich auf Menschen mit Geld ausrichten, und wenn das bedeutet, nur noch Reiche zu bedienen, wird es mehr Yachthersteller und weniger Dollar-Stores geben
Das Problem ist, dass Wähler absichtlich in einem Zustand der Informationsarmut gehalten werden, sodass sie sich leicht von externen Kräften manipulieren lassen
Die US-Regierung ist schlecht darin, die eigene Bevölkerung zu beeinflussen, und überlässt diese Aufgabe dem freien Markt
Deshalb stimmen die Menschen nicht für ihre eigenen Interessen, sondern für die Interessen der Propagandisten des freien Marktes, die auch in diese AI-Ergebnisse investiert haben
Dass Menschen verarmen, ist für die Eliten des freien Marktes völlig in Ordnung
Wenn man sich ansieht, wie Milliardäre in Indien leben, leben sie womöglich sogar besser als in den USA
Die Menschheit war schon auf die gegenwärtige Explosion der Ignoranz nicht vorbereitet
Wenn man sich frühe demokratische Modelle ansieht, hatte nicht einfach jeder mit Puls ein Wahlrecht
Es gab jeweils Heuristiken, um jene herauszufiltern, von denen man annahm, dass sie gebildeter sind und die Zügel der Macht in die Hand nehmen sollten
Wir sind nur nicht klug genug, andere Entscheidungen zu treffen
Die Gefahr liegt darin, dass Menschen AI nutzen, um andere Menschen zu kontrollieren, auszubeuten, zu zwingen und zu schädigen.
Das Risiko, dass AI mit genug Handlungsfähigkeit ausgestattet wird, um Menschen zu bedrohen, kommt erst danach; AI wird nur so viel Handlungsfähigkeit haben, wie wir ihr geben.
„Lebendig sein“ oder „Bewusstsein“ sind keine kurzfristigen Risiken.
Der Text listet diplomatische Maßnahmen auf, die beim Risikomanagement helfen könnten, beginnend mit einer „Einigung zwischen den USA und China“, aber alles klingt wie ein unrealistischer Traum.
Wir hatten etwa 80 Jahre relativen Friedens und Wohlstands, in denen wir einen Rahmen für internationale Einigkeit gegenüber Herausforderungen wie AI und Erderwärmung hätten schaffen können, aber die internationale Einigkeit ist schwächer als je zuvor.
In Geopolitik und Verteidigung ist nicht die Absicht das Problem, sondern die Fähigkeit anderer Länder, und die Fähigkeitskurve von LLMs bewegt sich aus unseren Diagrammen heraus.
Schon durch nukleare Proliferation und Erderwärmung sind wir in eine enge Ecke gedrängt worden, und Konflikte, die LLMs ermöglichen könnten, etwa Cyberkrieg oder Terror gegen Infrastruktur, könnten uns auch über diese anderen Grenzen hinaus treiben.
Die Demokratie scheint geschwächt, und LLMs werden wohl denjenigen mehr Macht geben, die über Social Media Konflikte erzeugen und die öffentliche Meinung kontrollieren wollen.
Wir kennen den Kreislauf: Es wird eine neue, für Menschen nützliche Technologie erfunden, und dann sehen wir zu, wie lange es dauert, bis Menschen Wege finden, sie zu missbrauchen.
Hier besteht zwar die Möglichkeit, dass LLMs genutzt werden, um die Probleme zu lösen, mit denen wir gleichzeitig umgehen müssen, aber es ist schwer vorstellbar, dass Menschen sie nicht noch schneller missbrauchen werden.
Dieser Text ist ein Ausgangspunkt, um darüber nachzudenken und zu sprechen, wie sich Risiken steuern lassen.
Das beste Ergebnis wäre, dass alles so gut gemanagt wird wie der Y2K-„Bug“, sodass man sagen kann: „Für den ganzen Aufruhr ist ja gar nichts passiert“, aber ein glatter Weg dorthin ist nicht zu erkennen.
Wenn physische und zentrale Ressourcen wie Energie und Materie weiterhin unter menschlicher Kontrolle stehen, warum sollte man dann annehmen, dass AI sich schnell in Superintelligenz verwandeln kann?
Der Mensch würde einen Weg zur Flucht finden.
Das gilt auch dann, wenn die Affen sich selbst noch so genial vorkommen.
Sie stellen eine Frage, auf die weder Sie noch die meisten Menschen die Antwort kennen, und nehmen fälschlich an, dass selbst ein Wesen, das weit intelligenter ist als Sie, die Antwort ebenfalls nicht kennen würde.
Mit „weit“ ist hier nicht der Unterschied zwischen Einstein und einem Durchschnittsmenschen gemeint, sondern der zwischen einem Hamster und einem Durchschnittsmenschen.
Wir sind immer noch Menschen, und das, was wir heute erreicht haben, hätte für Menschen des Mittelalters wie Magie gewirkt.
Wenn man sich nun ein superintelligentes Wesen vorstellt, das Dinge tut, die selbst uns heute wie Magie erscheinen würden, ist das überhaupt nicht absurd.
Eine solche Lücke existiert bereits zwischen dem Mittelalter und der Gegenwart.
Um abzuschätzen, was eine solche Intelligenz tun könnte, braucht man entsprechend Offenheit und Vorstellungskraft.
Dennoch könnte AI in den physischen Raum vordringen, wenn immer mehr Arten von Robotern eingesetzt werden.
Von welcher menschlichen Kontrolle spricht man in so einer Situation überhaupt?
Die Phase, in der Menschen formell noch den Stempel auf Ressourcenkontrolle setzen, wird nur ein kurzes Wackeln sein.
Wenn es im Economist steht, wird es vermutlich in Wirklichkeit nicht passieren.
Einen genauen Zeitpunkt haben sie auch nicht genannt.
Wie lange ist es noch bis zu vertrauenswürdiger AI?
Also etwa AI, die 80 % der Bürojobs erledigen kann, ohne mehr zu vermasseln als Menschen.
Denn sie setzt voraus, dass wir bereits wissen, dass sich 80 % der Bürojobs vollständig automatisieren lassen.
Wenn das so wäre, hätte nicht-AI-Software diese Arbeit bereits erledigt.
Zum Teil ist das auch so, aber es hat keine massenhafte Arbeitslosigkeit ausgelöst.
Vielleicht hat es Jobs reduziert, aber eher in der Art, wie Dateneingabe durch OCR ersetzt wurde.
Denn je stärker AI genutzt wird, desto mehr werden Arbeit und Prozesse an die Stärken und Schwächen von AI angepasst.
Das ist ähnlich wie bei der Automatisierung in der Fertigung.
Zuerst ergänzen Maschinen einige Teilschritte menschlicher Arbeit, am Ende wird jedoch der Prozess selbst rund um die Maschinen neu entworfen.
Schon die Richtung von Vibe Coding zeigt, wie sich der Fokus von Effizienz wegbewegt hat hin zu: „Wenn es einen Tag früher live geht, sind auch 100.000 Zeilen Code egal.“
Dasselbe gilt für AI-E-Mails, Kalender und Marketing.
AI nimmt den Menschen schon jetzt in ihrem aktuellen Zustand Jobs weg und ist dafür bereits gut genug.
Das Maß an Präzision, das wir implizit voraussetzen, wenn wir annehmen, wir seien besser als AI, ist für die meisten Jobs faktisch gar nicht nötig, und Unternehmensführungen beginnen das ebenfalls zu begreifen.
Wir befinden uns in einer sehr gefährlichen Lage.
Wie ein Frosch in heißem Wasser kurz vor dem Siedepunkt.
Wenn wir weiter nur in große Cloud-LLMs und Leute investieren, die damit nur Geschäfte machen wollen, etwa Musk, dann wird keine Intelligenzexplosion kommen.
Sie wird erst kommen, wenn AI so tief in unser Leben eingedrungen ist, dass wir ein gutes lokales Modell zu Hause für so selbstverständlich halten wie Strom.
Erst dann werden wir neu darüber nachdenken, was es bedeutet, AI wirklich in alles zu integrieren.