Vibe Coding, Automatisierung und MCP
(stdy.blog)Vibe Coding = an KI auslagern
Vibe Coding bedeutet im Kern, die Entwicklung eines Programms an KI auszulagern.
Wenn man auf Erfahrungen mit ausgelagerter Entwicklung zurückblickt, waren gute Auftraggeber meist in diesen Punkten stark:
- die Arbeit definieren, die zur Lösung meines Problems nötig ist
- so kommunizieren, dass Entwickler es gut verstehen können
- Ressourcen bereitstellen, damit das Programm gut gebaut werden kann
- prüfen, ob das fertige Programm die Arbeit wie beabsichtigt übernimmt
- in diesem Prozess vom Entwickler lernen, was man selbst noch nicht weiß, um es nach und nach selbst tun zu können
Überträgt man das auf die Perspektive eines Vibe Coders, ergibt sich:
- PRD und User Flow definieren
- gute Prompts und Anweisungen verwenden (z. B. Cursor Rules)
- Abweichungen von der Absicht erkennen und automatisierte Tests ausführen
- in diesem Prozess im Pingpong mit der KI lernen
Und was ist dann mit 3? Das kann man aus zwei Perspektiven des Programms betrachten:
- Erstens: Ein Programm muss irgendwo ausgeführt werden. → Ausführungs- und Deployment-Umgebung festlegen
- Zweitens: Ein Programm ist ein Bündel aus Code, das „Eingaben verarbeitet und Ausgaben erzeugt“. → Daten und APIs bereitstellen
Ein Programm muss ausgeführt werden
- Bei ausgelagerter Entwicklung endet die Verantwortung des Entwicklers meist bei der Implementierung des Codes, während Deployment und Betrieb beim Auftraggeber liegen.
- Stattdessen stellt der Entwickler Anleitungen bereit, damit der Auftraggeber das Programm ausführen kann.
- Als Auftraggeber kann man der KI sehr gut mitteilen, in welcher Umgebung sie Code ausführen und deployen soll.
- Besonders gut funktioniert das bei Code, der im Webbrowser läuft.
- Früher war es selbst für sehr einfache Skripte wie „einen Teil der Markdown-Syntax per regulärem Ausdruck aus einem Markdown-Dokument entfernen“ für Nicht-Entwickler nicht leicht, sie auszuführen oder zu deployen.
- Heute kann man mit Claude Artifacts, Gemini Canvas und Ähnlichem im Handumdrehen kleine eigene Programme bauen und ausführen. Wenn auch andere sie nutzen sollen, kann man sie mit Lovable erstellen und deployen – schnell, kostenlos und sofort.
- Vibe Coding bedeutet nicht zwingend, dass man eine „App“ bauen muss. Wenn es ein Programm ist, das mein Problem löst und wiederkehrende Arbeit reduziert, ist es egal, ob es eine App, ein Skript, GPTs oder ein Prompt ist.
APIs, die Programme nützlicher machen
- Kleine Programme haben jedoch Grenzen.
- Ein Markdown Remover ist weder mit einer DB noch mit einer API oder einem LLM verbunden.
- Deshalb muss der Nutzer den Text selbst eingeben und den ausgegebenen Text anschließend selbst kopieren und anderswo einfügen.
- Was wäre, wenn das Ziel des Nutzers wäre, „einen in Notion geschriebenen Text aufzubereiten und in Social Media zu posten“?
- Eingabe: nur den Link zur Notion-Seite eingeben
- Verarbeitung: den geladenen Text in ein LLM geben, ihn passend für Social Media zusammenfassen und dann die Markdown-Syntax entfernen
- Ausgabe: Text prüfen, freigeben und dann automatisch im eigenen Social-Media-Konto posten lassen
- Zum Preis von schneller Reaktionszeit und Allgemeinheit hätte man die Zeit und Energie des Nutzers für diese Aufgabe deutlich reduziert. Für diesen konkreten Zweck wäre das Programm also „nützlicher“.
- Letztlich hängt die Nützlichkeit eines Programms bei Eingabe, Verarbeitung und Ausgabe davon ab, wie viel Arbeit der Nutzer noch selbst erledigen muss.
- Eingabe automatisieren
- Verarbeitung komplexer machen
- Ausgabe automatisieren
- In typischen Programmen werden über APIs (also durch die Verbindung mit anderen Programmen) automatisierte Ein-/Ausgabe und anspruchsvollere Verarbeitung möglich.
- Eingabe: Notion-Berechtigung einholen und per Notion API den Seiteninhalt abrufen
- Verarbeitung: den Inhalt der Notion-Seite zusammen mit einem System Prompt an die LLM API senden und eine für Social Media passende Antwort erhalten
- Ausgabe: Threads-Berechtigung einholen und per Social-Media-API den Beitrag veröffentlichen
- So etwas zu bauen ist jedoch selbst für erfahrene Entwickler nicht besonders einfach – vor allem wegen der komplizierten Berechtigungen.
- Kann man das einfacher machen?
Automatisierungstools und MCP, die schwierige API-Integrationen übernehmen
- Mit Automatisierungstools wie Zapier oder Make muss man APIs nicht selbst integrieren.
- Beispiel: Wenn ein neues Item in einer Notion-DB auftaucht -> ChatGPT ausführen -> anschließend auf Instagram hochladen als Zap
- Um eigentlich die Instagram-Posting-API aufzurufen, müsste man eine eigene App bauen und sogar eine Prüfung durchlaufen.
- In Zapier oder Make ist die App für Instagram-Uploads bereits gebaut, und auch der komplette Flow für das Einholen von Berechtigungen und den Datenaustausch ist schon implementiert. Man muss sich also nicht selbst um die schwierigen Berechtigungsfragen kümmern.
- Für manche Leute kann jedoch selbst dieses Aufbauen von „erst dies, dann das“ schwierig oder lästig sein. MCP/A2A zielt darauf ab, dass genau diese Menschen alles über einen LLM-Chatbot erledigen können.
- So wie gewöhnliche Programme über APIs mehr als nur einfache Logik ausführen können, kann auch das Programm namens LLM-Chatbot über MCP mit anderen Programmen verbunden werden und damit mehr als nur einfache(?) Text-, Bild- oder Voice-Ausgaben leisten.
- Das bedeutet, dass in Claude Dinge wie „Zieh meinen Notion-Seiteninhalt, fasse ihn zusammen und poste ihn auf Instagram“ möglich werden.
- Natürlich muss man dafür passende MCP-Server (Notion, Instagram) mit dem MCP-Client (Claude) verbinden.
- Die wichtigste Rolle eines MCP-Servers besteht darin, über Tools stellvertretend APIs aufzurufen. Für Notion gibt es bereits einen offiziellen MCP-Server, für Instagram jedoch nicht.
- Wie soll Claude dann die Instagram-API aufrufen?
- Hier kommt wieder Zapier ins Spiel. Über die von Zapier oder Make bereitgestellten MCP-Server wird ein Instagram-Upload möglich.
- Anders gesagt: Verbindet man einen LLM-Chatbot per MCP mit einem Automatisierungstool, das bereits viele Integrationen mitbringt, wird das extrem leistungsfähig.
Potenzial und Grenzen von MCP
- Wenn man es so betrachtet, könnte man sich fragen, warum man überhaupt MCP nutzen sollte.
- Denn fast alle Aufgaben, die man aktuell mit Chatbot + MCP erledigen kann, lassen sich auch mit Automatisierungstools umsetzen.
- Der Autor hält das Potenzial von MCP aber aus drei Gründen für sehr groß:
- komfortable Benutzeroberfläche (ist ein Chatbot-Assistent, der alles erledigt, nicht das ultimative Programm?)
- bequemere Benutzereinbindung bei sensiblen Aufgaben
- nicht nur Aufgaben auf dem lokalen PC wie Dateisystem- oder Browser-Steuerung automatisieren, sondern auch mehr Informationen wie Ressourcen oder Prompt-Templates bereitstellen
- Bei der Nutzung von MCP gibt es auch einiges zu beachten.
- Je mehr man an MCP übergibt, desto stärker muss man auf Sicherheit achten. Deshalb sind offizielle Remote-MCP-Server sicherer als lokale.
- Gibt man dem LLM zu viele MCP-Tools, wird womöglich nicht das Tool ausgeführt, das man eigentlich will; außerdem gehen alle Tool-Definitionen als Input-Tokens mit, was Kosten und Zeit für den LLM-Aufruf erhöht.
- Auch die für LLMs typische Zufälligkeit muss man in kommerziellen Services immer im Blick behalten.
- Letztlich geht es immer um dasselbe: ob man APIs mit dem eigenen Programm verbindet, einen Automatisierungs-Flow entwirft oder einem LLM-Chatbot MCP gibt – es heißt immer „Mach meine Arbeit für mich“.
- Man muss sich also nicht stressen lassen, nur weil Keywords wie Make oder MCP plötzlich stark im Trend sind. Wichtig ist, auf eine Weise, die zu einem passt, ein Programm zu bauen, das die eigene Arbeit übernimmt, und dabei die Vor- und Nachteile der jeweiligen Ansätze zu verstehen.
Zusammenfassung
- Vibe Coding bedeutet, die ausgelagerte Programmentwicklung an KI zu übergeben.
- Solange ein Web-App, ein Code-Snippet oder ein Prompt meine Arbeit zuverlässig für mich übernimmt, kann all das ein nützliches Programm sein.
- Damit Programme nützlicher werden, brauchen sie API-Anbindungen für automatisierte Ein-/Ausgabe und anspruchsvollere Verarbeitung.
- Automatisierungstools lösen die Komplexität von API-Anbindungen stellvertretend.
- Auch das Programm LLM-Chatbot kann durch MCP-Anbindung nützlicher werden. Besonders leistungsfähig ist die Verbindung mit MCP-Servern, die von Automatisierungstools bereitgestellt werden.
- Man muss nicht nur API, Automatisierung oder MCP einzeln nutzen; kombiniert wird es oft einfacher und leistungsfähiger (z. B. nur Notion MCP an Claude hängen und in Zapier Notion-to-Instagram für automatisches Posten einrichten).
- Unter Berücksichtigung der Vor- und Nachteile sollten wir auf eine zu uns passende Weise Programme bauen, die unsere Probleme lösen – zusammen mit KI.
4 Kommentare
Mit Vibe Coding allein kann man das kaum als Outsourcing bezeichnen. Beim Outsourcing prüft man auf Projektebene, aber die heutigen KI-Coding-Agenten müssen eher auf der kleineren Task-Ebene kontrolliert werden.
Bei echtem Outsourcing müsste ich die Arbeit abgeben und mich um andere Dinge kümmern können … im Moment muss man sich aber noch viel zu oft darum kümmern. Wie ein kluger, aber unbeholfener Junior-Entwickler …
Schon bald … vielleicht noch nicht ganz wie Outsourcing, aber womöglich können sie wie ein kleines Entwicklungsteam arbeiten … denke ich. Aufgaben erteilen, laufend reviewen und korrigieren … aber noch scheint selbst das nicht ganz erreicht zu sein.
Vielleicht liegt es auch daran, dass mir das Vibe dafür fehlt …
https://tech.kakao.com/posts/700 Diesen Beitrag hatte ich gesehen und als ein gutes Beispiel für Vibe Coding empfunden; ich glaube, der Kontext ist ähnlich. Ich stimme dem von Ihnen Geschriebenen ebenfalls zu.
Dank dessen habe ich einen interessanten Artikel gelesen! Vielen Dank.
Was ist dann mit 3? -> Dabei geht es um die Unterstützung von Ressourcen.
Ich hatte oben mit 1, 2, 4, 5 nummeriert, aber in Markdown wurde das automatisch in 1234 geändert.