Google AI Studio – Eindrücke zu den Starter Apps
(stdy.blog)(Der Originalbeitrag enthält System-Prompts, Code-Snippets und GIFs)
- Mit dem Update von Google AI Studio wurde ein Bereich hinzugefügt, in dem man mit verschiedenen Mini-Apps (Starter Apps) auf Basis von Gemini herumspielen kann.
- Mehr als 10 Demos lassen sich durch Anpassen des Codes ausführen. Da ein eingebauter Gemini-API-Key verwendet wird, ist das kostenlos.
- Wenn man es allerdings zu oft nutzt, kommt ein 400-Fehler. Vermutlich gibt es etwas wie ein tägliches Aufruflimit.
- Mit einem anderen Account lässt es sich ausführen.
Vermutung: Warum hat Google diese Demos veröffentlicht?
- In letzter Zeit steht Gemini wegen seiner multimodalen Fähigkeiten im Fokus, also weil es nicht nur Text, sondern auch Bilder und Videos verstehen und erzeugen kann, sowie wegen seiner starken Coding-Fähigkeiten.
- Die meisten nutzen es jedoch nur innerhalb von LLM-Chatbots; auf API-Ebene wird es von normalen Nutzerinnen und Nutzern bislang eher selten eingesetzt.
- Vielleicht hat Google diese Demos veröffentlicht, weil man hofft, dass diese Fähigkeiten auch per API breit genutzt werden und damit Geld einbringen.
- Denn alle Demos sind Showcases dafür, wie sich Geminis Funktionen auf Code-Ebene zusammen mit anderen Google-APIs in Web-Apps umsetzen lassen.
Analyse der Demo-Prompts und des Codes
Ich habe mir zwei komplexere Beispiele angesehen.
Video Toys: Videos verstehen und erklären + Beispiel für Vibe Coding
- Eine Demo, die ein YouTube-Video mit Gemini 2.5 analysiert und daraus per Vibe Coding eine einfache interaktive Lernmaterial-App erstellt.
- Das Video wird dabei aus der Perspektive eines „Pädagogen und Produktdesigners mit Expertise darin, Lernerfahrungen als interaktive Web-App zu gestalten“ analysiert, anschließend wird eine Spezifikation für die Web-App erstellt und danach umgesetzt.
- Beim Beispielvideo wurde der Inhalt bereits analysiert, sodass sich die Lernmaterial-App direkt ausprobieren lässt.
- Anders als andere Demo-Apps, die aus nur wenigen Dateien bestehen, ist diese mit React aufgebaut.
- Nutzer können sowohl die von Gemini erzeugte Spezifikation für das Vibe Coding als auch den erzeugten Code selbst bearbeiten.
- Empfehlenswert für alle, die Services auf Basis von Videos oder zur Codegenerierung bauen möchten.
Maps Planner: Beispiel für Multimodalität + Function Calling + strukturierte Ausgabe + Maps API
- Gibt man einen Ortsnamen ein, erklärt die Demo diesen Ort; schaltet man den Day Planner Mode ein, erstellt sie einen Tagesreiseplan. Auch die Reisezeiten werden geschätzt.
- Sowohl General Explorer Mode als auch Day Planner Mode werden mit einem einzigen System-Prompt unterstützt.
- Beeindruckend ist, dass der System-Prompt je nach gewähltem Modus des Nutzers subtil angepasst wird.
- Es werden Funktionen definiert, mit denen Kartendaten präzise ein- und ausgegeben und Linien zwischen zwei Orten korrekt gezeichnet werden können, die Gemini dann aufruft.
- Solche Erweiterbarkeit ist vermutlich genau das, was man mit MCP erreichen möchte.
- Nicht nur die Prompts sind gut, auch der Umgang mit Maps API und Positionsdaten ist sauber gezeigt. Empfehlenswert für alle, die Services rund um Karten bauen möchten.
Selbst etwas bauen
- Demo-Apps lassen sich kopieren und anpassen. Es gibt auch viele Templates für Leute, die ganz von vorn anfangen.
- Ich habe die Bildgenerierungs-Demo Explain Things with Lots of Tiny Cats kopiert und meine eigene Version gebaut.
- Wenn man um eine Erklärung zu einem Konzept bittet, erzeugt die Demo mit Metaphern aus vielen Katzen eine Art Webtoon.
- Eindrucksvoll waren der Prompt, der fortlaufend Bildgenerierung auslöst (
No commentary, just begin your explanation. Keep going until you're done.), sowie der Code, der die so erzeugten Bilder einzeln als Stream anzeigt.
- Ich habe daraus eine koreanische Version mit Nilpferden gemacht: Nilpferde wissen alles.
- Dafür habe ich eine passende koreanische Schrift von Google Fonts geholt und HTML-Code sowie Prompt leicht angepasst.
- Es gibt zwar eine Funktion zum Teilen der eigenen App, sie funktioniert aber nicht gut.
- Da alle zugehörigen Dateien in Google Drive gespeichert werden, kann man stattdessen einfach wie beim Teilen normaler Dateien in Google Drive vorgehen.
Gemini Cookbook
- Während die Starter Apps eher unterhaltsame Beispiele für Web-Apps sind, gibt es dort viele verschiedene Python-Beispiele.
- Auch Beispiele für das erst vor wenigen Stunden veröffentlichte Gemini 2.5 Flash sind enthalten.
- Gut geeignet als Referenz für alle, die generative-AI-Services entwickeln möchten.
Noch keine Kommentare.