„Software im Zeitalter der AI“ – Video von Andrej Karpathys Vortrag an der YC AI School

(youtube.com)

29 Punkte von GN⁺ 2025-06-19 | 2 Kommentare | Auf WhatsApp teilen

"Software is Changing (Again)"
Das Software-Paradigma verändert sich nach 70 Jahren grundlegend und hat sich in den letzten Jahren rasant zu Software 1.0 (traditioneller Code), 2.0 (Gewichte neuronaler Netze), 3.0 (LLMs und natürlichsprachliche Prompts) weiterentwickelt
LLMs etablieren sich nicht nur als einfache Tools, sondern als neues Software-Ökosystem ähnlich einem Betriebssystem (Operating System), und es beginnt eine Ära, in der jede Person Computer in natürlicher Sprache wie Englisch programmieren kann
Die Zusammenarbeit mit AI-Tools und -Agenten sowie „partielle Autonomie“ (Partial Autonomy) werden zum Kern künftiger Softwareprodukte, müssen aber von schneller menschlicher Verifikation und Kontrolle begleitet werden, um vertrauenswürdig zu sein
AI und LLMs besitzen Eigenschaften von „people spirits“, mit enormem Gedächtnis und Wissensvermögen, zugleich aber auch mit inhärenten Grenzen wie Halluzinationen, Kontextverlust und Sicherheitsrisiken
Künftig müssen Software, Dokumentation und Infrastruktur „agentenfreundlich“ (LLMs-friendly) neu gestaltet werden, sodass sich Struktur und Ausdrucksweise ändern, damit LLMs Inhalte leicht verstehen und darauf handeln können

Software 1.0 → 2.0 → 3.0: Evolution des Paradigmas

Software 1.0: traditioneller Source Code, direkt von Menschen geschrieben
Software 2.0: Modelle, die durch das Tuning der Gewichte (Parameter) neuronaler Netze mit Datensätzen und Optimierern erstellt werden
Software 3.0: auf Large Language Models (LLMs) basierend, erzeugt Programme (Anweisungen) durch natürlichsprachliche Prompts wie Englisch

Auf GitHub entwickelt sich Code zuletzt zu einer Mischform aus Englisch und Code, wobei sich Englisch als Programmiersprache schnell verbreitet
Hugging Face übernimmt gewissermaßen die Rolle von GitHub für Software 2.0 und führt das Open-Source-Modell-Ökosystem an

LLMs sind ein neues Betriebssystem (OS)

LLMs entwickeln sich über einfache APIs und Utilities hinaus zu Plattformen, auf denen wie bei einem Betriebssystem verschiedenste Software läuft
Derzeit erfolgt die Nutzung von LLMs, ähnlich wie in der Mainframe-Ära der 1960er, in einer Cloud-zentrierten, zentralisierten Struktur
Langfristig wird auch die Möglichkeit eines Zeitalters persönlicher LLMs (verteilte und lokale Nutzung) erwähnt
Die Nutzungsumgebung für LLMs ähnelt traditionellen Terminal- und Command-Line-Interfaces, doch eine universelle GUI ist noch nicht ausreichend entwickelt

Fähigkeiten und Grenzen von LLMs

LLMs verfügen über enormes Gedächtnis und große Fähigkeiten zur Wissensaneignung, haben aber auch inhärente Schwächen wie Halluzinationen (Falschinformationen), Verlust des Kontextgedächtnisses und Sicherheitslücken
Der Arbeitskontext (working memory) von LLMs muss von Menschen explizit verwaltet werden; langfristiges Kontextlernen ist noch unzureichend
Wegen realer Risikofaktoren wie Sicherheit und Prompt Injection ist bei der Nutzung Vorsicht geboten

Partielle Autonomie und Zusammenarbeit zwischen Mensch und LLM

LLM-basierte Apps wie Cursor und Perplexity entwickeln sich durch die Verbindung traditioneller manueller Bedienung mit LLM-Automatisierung weiter, inklusive des Konzepts eines „Autonomy Sliders“ (Steuerung des Grads von Nutzerkontrolle bzw. AI-Delegation)
Audit über GUIs und schnelle Verifikationsschleifen sowie eine Methodik, AI eng geführt und kontrolliert einzusetzen, sind in der Praxis unverzichtbar
Für Software, Produkte und Services wird prognostiziert, dass die „partielle Autonomisierung“ schrittweise zunehmen wird

Praxisbeispiele und die Kultur des „Vibecoding“

Eine „Vibecoding“-Kultur, in der jede Person über Englisch direkt mit LLMs Apps erstellt, breitet sich aus
Karpathy berichtet auch von der Erfahrung, in nur einem Tag mit einer Sprache ohne eigene Coding-Erfahrung (Swift) eine iOS-App zu bauen und sie zu einem realen Service auszubauen
Für die eigentliche Prototypenentwicklung machen es LLMs leicht, doch die tatsächliche Produktivsetzung (Authentifizierung, Zahlung, Deployment usw.) bleibt weiterhin ein Engpass mit viel Handarbeit und DevOps
Künftig wird die Gestaltung agentenfreundlicher Software und Dokumentation zur zentralen Aufgabe, damit „Agenten“ Aufgaben übernehmen können, die Menschen bisher selbst klicken und konfigurieren müssen

Wandel von Dokumentation und Infrastruktur sowie Agentenfreundlichkeit

Bestehende, menschenzentrierte Dokumentation (Klicks, Reihenfolge usw.) ist für die direkte Nutzung durch LLMs und Agenten ungeeignet, weshalb eine Neuaufbereitung auf Basis von Markdown und Befehlen nötig ist
Versell, Stripe und andere haben damit begonnen, agentenfreundliche Dokumentation einzuführen (z. B. curl-Befehle)
Verschiedene Tools (GitHub Ingest, DeepWiki usw.) wandeln Code-Repositories und Dokumentation in Formen um, die LLMs direkt nutzen können

Fazit und Ausblick

Jetzt ist die beste Zeit, große Mengen an Code neu zu schreiben und umzuschreiben
LLMs werden als „unterstützendes Tool (Iron-Man-Anzug)“ mit menschlichen Entwicklern zusammenarbeiten, während eine schrittweise Innovation in Richtung vollständiger Autonomie voranschreitet
In den kommenden 10 Jahren dürfte die schrittweise Erhöhung des „Autonomy Sliders“ der zentrale Trend werden
Entwickler und Organisationen müssen die Neugestaltung von Software, Dokumentation und Infrastruktur, optimiert für LLMs und Agenten, beschleunigen

2 Kommentare

laeyoung 2025-06-24

Dieses Video ist großartig! Darin wird auf Andrew Ngs Aussage „AI Is the New Electricity“ Bezug genommen, und es wird erklärt, dass es so ist, als wäre der Strom ausgefallen, wenn ChatGPT, das von 800 Millionen Menschen genutzt wird, ausfällt — das fand ich wirklich sehr einleuchtend.

GN⁺ 2025-06-19

Hacker-News-Kommentare

Es wird der Eindruck vermittelt, dass Karpathys Analogien und sein präziser Blick auf die Realität wirklich großartig sind.
Es wird die Meinung geäußert, dass der parallele Vergleich von traditionellem Coding, neuronalen Netzwerkgewichten und Prompts interessant ist; als Beispiel wird erklärt, dass es bei einem Modul für autonomes Fahren in der Praxis recht nützlich sein kann, ein neuronales Netzwerk auf einen Datensatz zu optimieren, der das Zielobjekt gut repräsentiert, statt direkt geschriebenen Code zu verwenden. Zugleich wird jedoch betont, dass der Anwendungsbereich, den „Software 2.0“ oder „Software 3.0“ eröffnen, in vielen Umgebungen wegen Hardware-Beschränkungen sehr begrenzt sein dürfte. Geteilter Standpunkt ist, dass bestehender Code und Prompts als Werkzeuge komplementär genutzt werden und keines von beiden die perfekte Lösung ist.
Karpathy wird dafür gelobt, immer klar zu denken, und es wird erwähnt, dass die Analogien eindrucksvoll sind. Nachdem man gesehen habe, dass Waymo bereits 2013 unterbrechungsfreies autonomes Fahren möglich machte, werde Neugier darüber geäußert, ob die schnelle Skalierung damals an Regulierung lag oder an der Schwierigkeit, das Fahren zu optimieren. Außerdem wird ai-2027.com erwähnt, da auf einer der Folien „AGI 2027“ gestanden habe.
Es wird kurz angemerkt, dass man überrascht sei, dass der Vortrag viel früher als geplant veröffentlicht wurde.
Dank dafür, dass YC den Talk geteilt hat, bevor er veraltet wirkt, zusammen mit dem Link zu einem relevanten Tweet (https://x.com/karpathy/status/1935077692258558443).