- "Software is Changing (Again)"
- Das Software-Paradigma verändert sich nach 70 Jahren grundlegend und hat sich in den letzten Jahren rasant zu Software 1.0 (traditioneller Code), 2.0 (Gewichte neuronaler Netze), 3.0 (LLMs und natürlichsprachliche Prompts) weiterentwickelt
- LLMs etablieren sich nicht nur als einfache Tools, sondern als neues Software-Ökosystem ähnlich einem Betriebssystem (Operating System), und es beginnt eine Ära, in der jede Person Computer in natürlicher Sprache wie Englisch programmieren kann
- Die Zusammenarbeit mit AI-Tools und -Agenten sowie „partielle Autonomie“ (Partial Autonomy) werden zum Kern künftiger Softwareprodukte, müssen aber von schneller menschlicher Verifikation und Kontrolle begleitet werden, um vertrauenswürdig zu sein
- AI und LLMs besitzen Eigenschaften von „people spirits“, mit enormem Gedächtnis und Wissensvermögen, zugleich aber auch mit inhärenten Grenzen wie Halluzinationen, Kontextverlust und Sicherheitsrisiken
- Künftig müssen Software, Dokumentation und Infrastruktur „agentenfreundlich“ (LLMs-friendly) neu gestaltet werden, sodass sich Struktur und Ausdrucksweise ändern, damit LLMs Inhalte leicht verstehen und darauf handeln können
Software 1.0 → 2.0 → 3.0: Evolution des Paradigmas
- Software 1.0: traditioneller Source Code, direkt von Menschen geschrieben
- Software 2.0: Modelle, die durch das Tuning der Gewichte (Parameter) neuronaler Netze mit Datensätzen und Optimierern erstellt werden
- Software 3.0: auf Large Language Models (LLMs) basierend, erzeugt Programme (Anweisungen) durch natürlichsprachliche Prompts wie Englisch
- Auf GitHub entwickelt sich Code zuletzt zu einer Mischform aus Englisch und Code, wobei sich Englisch als Programmiersprache schnell verbreitet
- Hugging Face übernimmt gewissermaßen die Rolle von GitHub für Software 2.0 und führt das Open-Source-Modell-Ökosystem an
LLMs sind ein neues Betriebssystem (OS)
- LLMs entwickeln sich über einfache APIs und Utilities hinaus zu Plattformen, auf denen wie bei einem Betriebssystem verschiedenste Software läuft
- Derzeit erfolgt die Nutzung von LLMs, ähnlich wie in der Mainframe-Ära der 1960er, in einer Cloud-zentrierten, zentralisierten Struktur
- Langfristig wird auch die Möglichkeit eines Zeitalters persönlicher LLMs (verteilte und lokale Nutzung) erwähnt
- Die Nutzungsumgebung für LLMs ähnelt traditionellen Terminal- und Command-Line-Interfaces, doch eine universelle GUI ist noch nicht ausreichend entwickelt
Fähigkeiten und Grenzen von LLMs
- LLMs verfügen über enormes Gedächtnis und große Fähigkeiten zur Wissensaneignung, haben aber auch inhärente Schwächen wie Halluzinationen (Falschinformationen), Verlust des Kontextgedächtnisses und Sicherheitslücken
- Der Arbeitskontext (working memory) von LLMs muss von Menschen explizit verwaltet werden; langfristiges Kontextlernen ist noch unzureichend
- Wegen realer Risikofaktoren wie Sicherheit und Prompt Injection ist bei der Nutzung Vorsicht geboten
Partielle Autonomie und Zusammenarbeit zwischen Mensch und LLM
- LLM-basierte Apps wie Cursor und Perplexity entwickeln sich durch die Verbindung traditioneller manueller Bedienung mit LLM-Automatisierung weiter, inklusive des Konzepts eines „Autonomy Sliders“ (Steuerung des Grads von Nutzerkontrolle bzw. AI-Delegation)
- Audit über GUIs und schnelle Verifikationsschleifen sowie eine Methodik, AI eng geführt und kontrolliert einzusetzen, sind in der Praxis unverzichtbar
- Für Software, Produkte und Services wird prognostiziert, dass die „partielle Autonomisierung“ schrittweise zunehmen wird
Praxisbeispiele und die Kultur des „Vibecoding“
- Eine „Vibecoding“-Kultur, in der jede Person über Englisch direkt mit LLMs Apps erstellt, breitet sich aus
- Karpathy berichtet auch von der Erfahrung, in nur einem Tag mit einer Sprache ohne eigene Coding-Erfahrung (Swift) eine iOS-App zu bauen und sie zu einem realen Service auszubauen
- Für die eigentliche Prototypenentwicklung machen es LLMs leicht, doch die tatsächliche Produktivsetzung (Authentifizierung, Zahlung, Deployment usw.) bleibt weiterhin ein Engpass mit viel Handarbeit und DevOps
- Künftig wird die Gestaltung agentenfreundlicher Software und Dokumentation zur zentralen Aufgabe, damit „Agenten“ Aufgaben übernehmen können, die Menschen bisher selbst klicken und konfigurieren müssen
Wandel von Dokumentation und Infrastruktur sowie Agentenfreundlichkeit
- Bestehende, menschenzentrierte Dokumentation (Klicks, Reihenfolge usw.) ist für die direkte Nutzung durch LLMs und Agenten ungeeignet, weshalb eine Neuaufbereitung auf Basis von Markdown und Befehlen nötig ist
- Versell, Stripe und andere haben damit begonnen, agentenfreundliche Dokumentation einzuführen (z. B.
curl-Befehle)
- Verschiedene Tools (GitHub Ingest, DeepWiki usw.) wandeln Code-Repositories und Dokumentation in Formen um, die LLMs direkt nutzen können
Fazit und Ausblick
- Jetzt ist die beste Zeit, große Mengen an Code neu zu schreiben und umzuschreiben
- LLMs werden als „unterstützendes Tool (Iron-Man-Anzug)“ mit menschlichen Entwicklern zusammenarbeiten, während eine schrittweise Innovation in Richtung vollständiger Autonomie voranschreitet
- In den kommenden 10 Jahren dürfte die schrittweise Erhöhung des „Autonomy Sliders“ der zentrale Trend werden
- Entwickler und Organisationen müssen die Neugestaltung von Software, Dokumentation und Infrastruktur, optimiert für LLMs und Agenten, beschleunigen
2 Kommentare
Dieses Video ist großartig! Darin wird auf Andrew Ngs Aussage „AI Is the New Electricity“ Bezug genommen, und es wird erklärt, dass es so ist, als wäre der Strom ausgefallen, wenn ChatGPT, das von 800 Millionen Menschen genutzt wird, ausfällt — das fand ich wirklich sehr einleuchtend.
Hacker-News-Kommentare