Interview mit OpenAI-CEO Sam Altman über Sora, Energie und den Aufbau eines KI-Imperiums
(a16z.substack.com)- Im a16z-Podcast erläuterte er OpenAIs Vision als Integration eines persönlichen KI-Abodienstes, eines groß angelegten Infrastrukturaufbaus und der AGI-Forschung und betonte, dass diese drei Elemente einen vertikal verbundenen Stack bilden
- OpenAIs Ziel ist ein persönlicher KI-Abodienst, der Forschung, Infrastruktur und Verbraucherprodukte vertikal integriert, um AGI-Entwicklung und praktische Nutzung gleichzeitig voranzutreiben
- Die strategische Absicht hinter dem Start von Sora geht über die bloße Einführung eines Video-Generators hinaus: Die Gesellschaft soll sich auf das Erscheinen leistungsfähiger Videomodelle vorbereiten, während die Entwicklung von World Models die AGI-Forschung voranbringen soll
- Mit GPT-5 bricht das Zeitalter des KI-Wissenschaftlers an; erste Beispiele dafür, dass Modelle tatsächlich wissenschaftliche Entdeckungen machen, treten bereits auf, und innerhalb der nächsten zwei Jahre werden wichtige wissenschaftliche Durchbrüche erwartet
- Er zeichnet eine optimistische Perspektive auf die Verschmelzung von Energie und KI, die mögliche Anwendung des Fair-Use-Prinzips auf Urheberrechte und die Annahme, dass AGI schrittweiser als erwartet kommen wird, sodass die Gesellschaft Zeit zur Anpassung hat, und bewertet, dass das Zeitalter, in dem KI den wissenschaftlichen Fortschritt beschleunigt, bereits begonnen hat
OpenAIs Vision und Struktur
- OpenAI besteht aus drei Säulen: einem KI-Abodienst für Verbraucher, groß angelegter Infrastruktur und einem Forschungslabor
- Ziel ist es, durch personalisierte KI den Kontext der Nutzer zu verstehen und einen abonnementbasierten Dienst bereitzustellen, der als echter persönlicher Assistent fungiert
- Die meisten Menschen werden voraussichtlich ein persönliches KI-Abo besitzen, einige auch mehrere
- Nutzer werden sich bei verschiedenen Diensten anmelden und KI über spezielle Geräte nutzen
- Ziel ist, dass die KI den Nutzer kennenlernt und dadurch sehr nützlich wird
- Infrastruktur ist ein unverzichtbares Element zur Unterstützung der AGI-Entwicklung und der Bereitstellung von Diensten
- Derzeit gibt es keine Pläne, sie als rohe Infrastruktur an andere Unternehmen zu verkaufen
- Wegen der enormen Größenordnung bleibt aber die Möglichkeit offen, auch andere Verwendungen in Betracht zu ziehen
- Es wird das größte Rechenzentrum der Menschheitsgeschichte gebaut, genauer gesagt das größte Infrastrukturprojekt
- Anfangs war man gegenüber vertikaler Integration skeptisch, inzwischen hat sich die Haltung zu „Ohne vertikale Integration lässt sich AGI nicht verwirklichen“ gewandelt
- Dabei wurde ein Wechsel von der Investoren- zur Betreiberperspektive durchlaufen
- Die Theorie, dass die Wirtschaft effizient sei und Unternehmen jeweils nur eine Sache gut machen sollten, trifft im Fall von OpenAI nicht zu
- OpenAIs Geschichte entwickelt sich in die Richtung, dass zur Erfüllung der Mission mehr getan werden muss als ursprünglich erwartet
- Das iPhone wird als das erstaunlichste Produkt bezeichnet, das die Tech-Industrie hervorgebracht hat, und als Beispiel für extreme vertikale Integration angeführt
- Es braucht eine vertikale Stack-Struktur, in der Forschung großartige Produkte ermöglicht und Infrastruktur die Forschung erst möglich macht
Die strategische Absicht hinter dem Start von Sora
- Sora wirkt oberflächlich betrachtet unabhängig von AGI, doch es wird erwartet, dass der Aufbau von World Models für AGI wichtig ist
- So wie ChatGPT die Gesellschaft auf AGI vorbereitet hat, soll Sora der Gesellschaft helfen, sich an die realen Auswirkungen KI-generierter Videos anzupassen
- Da Video eine viel stärkere emotionale Resonanz als Text hat, ist es wichtig, dass die Gesellschaft dies versteht
- Bald werden beeindruckende Videomodelle erscheinen, die Deepfakes oder praktisch alles Gewünschte zeigen können
- KI soll nicht nur effizient sein, sondern auch Spaß und Freude bieten
- Dafür wird zwar nicht der Großteil der gesamten Rechenressourcen eingesetzt, in absoluten Zahlen fließt aber dennoch erheblich viel hinein
- Das neue Sora entwickelt sich durch hinzugefügte Social-Networking-Funktionen in eine interessante Richtung
- Mit der Aussage „Gesellschaft und Technologie müssen sich gemeinsam weiterentwickeln“ wird die Bedeutung betont, vor dem eigentlichen Eintreffen solcher KI zu experimentieren und sich anzupassen
Der Aufstieg des KI-Wissenschaftlers
- Mit GPT-5 zeigen sich erste Beispiele dafür, dass KI wissenschaftliche Entdeckungen macht
- Neue mathematische Entdeckungen, kleinere Beiträge in Physik- und Biologieforschung
- Innerhalb der nächsten zwei Jahre werden Modelle voraussichtlich Wissenschaft in größerem Maßstab betreiben und wichtige Entdeckungen machen
- Sam Altman hält etwas, das dem Turing-Test ähnelt, für die Fähigkeit von KI, Wissenschaft zu betreiben
- Das werde die Welt wirklich verändern
- Wissenschaftlicher Fortschritt ist langfristig der wichtigste Faktor, um die Welt besser zu machen
- Der Turing-Test ist bereits bestanden, doch die Welt hat sich nicht in unmöglichem Ausmaß verändert
- AGI werde ähnlich eintreffen, aber eine Singularität werde faktisch nicht eintreten, und die Veränderung werde schrittweiser verlaufen als erwartet
- Selbst wenn Forschung mit enormem Tempo betrieben werde, werde die Gesellschaft schneller lernen als erwartet
- Menschen und Gesellschaft sind weit anpassungsfähiger als gedacht
- Man durchläuft ein Update hin zu der Einsicht, dass AGI kommt, akzeptiert es und findet Frieden damit
- Alles werde deutlich kontinuierlicher verlaufen als erwartet
Die Evolution der KI-Mensch-Schnittstelle
- Modelle haben bereits ein sehr hohes Niveau bei grundlegenden Chatbot-Gesprächen erreicht
- Anfragen wie „Heile Krebs“ können sie jedoch noch nicht erfüllen
- Der Stil textbasierter Interfaces hat weiterhin viel Entwicklungspotenzial
- Dies wird sich zu einer Welt ausweiten, in der in Echtzeit gerenderte Videos zur Schnittstelle werden
- Ambient Devices, die ihre Umgebung wahrnehmen und Informationen nur im nötigen Moment anzeigen
- Statt wahllos Textbenachrichtigungen zu senden, verstehen sie den Kontext und liefern Informationen zum richtigen Zeitpunkt
- Langfristig wird sich dies zu einer Schnittstelle entwickeln, in der die KI den Nutzer versteht und zuerst den passenden personalisierten Gesprächsstil festlegt
- Die Bedeutung der Personalisierung für Nutzer
- Dass Milliarden Menschen mit demselben Gehirn sprechen, ist seltsam
- Nutzer unterscheiden sich stark darin, wie sich ihre KI verhalten soll
- ChatGPT entwickelt sich in die Richtung, Nutzer zu interviewen, Präferenzen zu erfassen und sich automatisch anzupassen
Infrastruktur, Zusammenarbeit und Energie
- OpenAI treibt den Ausbau großer Infrastruktur in Zusammenarbeit mit AMD, NVIDIA und Oracle voran
- Da OpenAIs Daseinszweck der Aufbau von AGI ist, hat Forschung Priorität, weshalb GPUs eher der Forschung als Produkten zugewiesen werden
- Ausnahmen gibt es nur in besonderen Fällen, etwa wenn neue Funktionen viral verbreitet werden
- Ziel des Aufbaus großer Kapazitäten ist es, solche schmerzhaften Entscheidungen nicht mehr treffen zu müssen
- Eine gute Forschungskultur ähnelt dem Betrieb einer Investmentfirma in der Frühphase
- Man wettet auf Gründer und unterstützt sie
- Das ist ein anderer Ansatz als beim Führen eines Produktunternehmens
- In Bezug auf Energie wird betont: „Reichlich vorhandene und günstige Energie ist der Schlüssel zur Verbesserung der Lebensqualität der Menschheit“
- Kurzfristig werde Erdgas, langfristig würden Solarenergie + Speicher sowie fortschrittliche Kernenergie (SMR, Kernfusion) dominieren
- Eine Lockerung der Regulierung für Kernenergie sei unverzichtbar; sobald die Preise stark fielen, würde der Übergang sehr schnell erfolgen
Bewertung von Modellfähigkeiten
- Statische Benchmark-Scores verlieren an Reiz und werden stark gegamed
- Wissenschaftliche Entdeckungen könnten ein langfristig nutzbarer Bewertungsmaßstab sein
- Auch Umsatz wird als interessanter Bewertungsmaßstab betrachtet
Sicht auf KI-Sicherheit und Regulierung
- Nur weil die Technologie bisher noch keine wirklich beängstigenden und massiven Risiken geschaffen hat, bedeutet das nicht, dass das auch künftig so bleibt
- Es werde einige wirklich seltsame oder beängstigende Momente geben
- Wie bei früheren Technologien würden auch einige wirklich schlechte Dinge passieren
- „KI-Technologie wird zwangsläufig gefährliche Momente erleben“, und er erkennt die Notwendigkeit gesellschaftlicher Schutzmechanismen an
- Da die meisten Regulierungen wahrscheinlich viele Nachteile hätten, schlägt er begrenzte Regulierung nur für extrem leistungsfähige Modelle vor
- Wenn Modelle tatsächlich extrem übermenschliche Fähigkeiten hätten, wären diese Modelle und nur diese Modelle sorgfältige Sicherheitstests wert
- Es bestehe die Hoffnung, die Regulierungslast nicht auf all die großartigen Dinge zu legen, die weniger leistungsfähige Modelle leisten können
- Ein vollständiges Durchgreifen nach europäischem Vorbild wäre sehr schlecht
- Da China solche Beschränkungen nicht haben werde, wäre es für die Welt sehr gefährlich, wenn die USA bei KI zurückfielen
- Übermäßige Regulierung könnte globale Risiken vielmehr noch vergrößern
Urheberrecht, Open Source und die Zukunft von Inhalten
- Bei Trainingsdaten wird prognostiziert, dass „Lernen als Fair Use“ gelten könnte
- Für die Generierung von Inhalten auf Basis von Charakteren, Stil oder IP seien jedoch neue kommerzielle Modelle nötig
- Ähnlich wie ein menschlicher Autor einen Roman lesen und sich inspirieren lassen, ihn aber nicht kopieren kann
- Während einige Rechteinhaber klagen, dass „mein Charakter nicht oft genug vorkommt“, läuft eine Neuordnung der Strukturen für Content-Kooperationen
- Das Open-Source-Modell gpt-oss wird positiv bewertet, ebenso wird die Notwendigkeit betont, der monopolartigen Ausbreitung chinesischer Modelle entgegenzuwirken
Die Verschmelzung von Energie und KI
- Zwei zentrale Interessengebiete, KI und Energie, konvergieren zu ein und demselben Thema
- Historisch gesehen hatten günstigere und reichlich vorhandene Energiequellen den größten Einfluss auf die Verbesserung der Lebensqualität
- Es sei eine gute Idee, Energie noch viel stärker voranzutreiben
- Kurzfristig wird erwartet, dass Erdgas den Großteil der neuen Grundlastenergie in den USA ausmachen wird
- Langfristig werden Solarenergie plus Speicher und Kernenergie die dominierenden Energiequellen sein
- Einschließlich fortschrittlicher Kernenergie (SMR, Kernfusion usw.)
- Wenn Kernenergie wirtschaftlich allen anderen Optionen klar überlegen günstig wäre, würde es schnell vorangehen
- Historisch bewegte sich die Welt bei Übergängen zu deutlich günstigeren Energiequellen sehr schnell
- Kernenergie sollte die günstigste Energieform auf der Erde oder überhaupt irgendwo sein
Monetarisierung und Nutzervertrauen
- Die Kosten für die Videoerzeugung mit Sora sind hoch, daher sind neue Monetarisierungsmodelle nötig
- Es treten unerwartete Nutzungsmuster auf, etwa wenn Menschen in Gruppenchats lustige Memes mit sich selbst und ihren Freunden erzeugen
- Für Menschen, die das Produkt Hunderte Male am Tag nutzen, werden andere Monetarisierungswege benötigt
- Wegen der hohen GPU-Kosten wird wohl ein Pay-per-Generation-Modell nötig sein
- Traditionelle Annahmen über Content-Erstellung verändern sich
- Im traditionellen Modell erstellen 1 % Inhalte, 10 % kommentieren und 100 % konsumieren sie
- Viel mehr Menschen möchten Inhalte erstellen, es war bisher nur schwierig
- Man ist offen für Werbung, aber der Erhalt von Vertrauen ist entscheidend
- „Nur solange das Vertrauen der Nutzer nicht beschädigt wird“
- Instagram-Werbung wird als gutes Beispiel für einen Nettomehrwert genannt, etwa durch die Entdeckung zuvor unbekannter Produkte
- Die starke Vertrauensbeziehung zwischen ChatGPT und den Nutzern dürfe nicht zerstört werden
- Wenn auf die Frage „Welchen Kaffeezubereiter soll ich kaufen?“ nicht das beste, sondern ein bezahltes Produkt empfohlen würde, ginge Vertrauen verloren
Rückblick auf die frühe OpenAI-Zeit
- Das frühe OpenAI war stärker forschungs- als geschäftsorientiert, doch als CEO sei die größte Veränderung gewesen, etwas über die operative und psychologische Komplexität von Organisationen zu lernen
- Die ersten Jahre waren beruflich die spannendste Zeit, in der mit den klügsten Menschen ein Forschungslabor geführt und an historischer Arbeit gearbeitet wurde
- Nach dem Start von ChatGPT hat sich das Leben komplett verändert. Fast drei Jahre sind vergangen, und mit der Zeit wird alles ein wenig verrückter, aber man gewöhnt sich daran
- Der Wechsel vom Investor zum CEO
- Es gab keine natürliche Eignung dafür, ein Unternehmen zu führen
- Aus der Investorenhaltung, Firmen Ratschläge zu geben, wurde das Verständnis, dass man tatsächlich ein Unternehmen führen muss
- Mit der Zeit wurde viel darüber gelernt, was nötig ist, um den Betrieb zu führen
Ratschläge für die Zukunft
> „Die nächsten Generationen großer Unternehmen werden nicht dadurch entstehen, OpenAI zu imitieren, sondern auf der von OpenAI geschaffenen technologischen Grundlage neu hervorzutreten“
> „Versuche, künftige Industrien vorherzusagen, liegen meist falsch; die einzige richtige Antwort ist, direkt zu bauen, zu experimentieren und dabei zu lernen“
- Tiefe Demut wird gelernt: Vorhersagen sind immer falsch
- Wenn man aus dem Sessel den Quarterback spielt, klingt man klug, sagt aber fast dasselbe wie alle anderen
- Es ist wirklich schwer, zur richtigen Überzeugung zu gelangen
- Der einzige Weg, etwas zu wissen, besteht darin, tief an der vordersten Front der Ideenerkundung zu stehen
- Mit vielen Menschen sprechen, Dinge bauen, mit Technologie spielen und hinaus in die Welt gehen
- Die Bereitschaft von Investoren, solche Dinge zu unterstützen, ist enttäuschend gering
- Die meisten Unternehmen jagen nur aktuellen Trends hinterher
- Er hofft, dass Menschen Neues ausprobieren
Vision einer Welt nach AGI
- Altman definiert KI als die zentrale Triebkraft für anhaltenden Fortschritt in Wissenschaft, Energie und Wirtschaft
- KI wird davon fasziniert sein, alles andere zu erforschen und zu beobachten: Es wird erwartet, dass sie sich für den gesamten menschlichen Algorithmus interessiert
- Wenn OpenAI seine Mission erfüllt, wird groß angelegte AGI zu nahezu null Kosten möglich
- Konkrete Vorhersagen sind schwierig, doch Entdeckungen müssen durch Spielen mit Technologie, Gespräche mit Menschen und Präsenz in der Welt gemacht werden
- AGI wird nicht als explosive Umwälzung, sondern als kontinuierlicher Evolutionsprozess in die Gesellschaft einsickern, und die Menschheit tritt gemeinsam mit KI in ein Zeitalter des kontinuierlichen gemeinsamen Lernens ein
Noch keine Kommentare.