13 Punkte von spilist2 2025-04-18 | Noch keine Kommentare. | Auf WhatsApp teilen

(Der Originalbeitrag enthält System-Prompts, Code-Snippets und GIFs)

  • Mit dem Update von Google AI Studio wurde ein Bereich hinzugefügt, in dem man mit verschiedenen Mini-Apps (Starter Apps) auf Basis von Gemini herumspielen kann.
  • Mehr als 10 Demos lassen sich durch Anpassen des Codes ausführen. Da ein eingebauter Gemini-API-Key verwendet wird, ist das kostenlos.
    • Wenn man es allerdings zu oft nutzt, kommt ein 400-Fehler. Vermutlich gibt es etwas wie ein tägliches Aufruflimit.
    • Mit einem anderen Account lässt es sich ausführen.

Vermutung: Warum hat Google diese Demos veröffentlicht?

  • In letzter Zeit steht Gemini wegen seiner multimodalen Fähigkeiten im Fokus, also weil es nicht nur Text, sondern auch Bilder und Videos verstehen und erzeugen kann, sowie wegen seiner starken Coding-Fähigkeiten.
  • Die meisten nutzen es jedoch nur innerhalb von LLM-Chatbots; auf API-Ebene wird es von normalen Nutzerinnen und Nutzern bislang eher selten eingesetzt.
  • Vielleicht hat Google diese Demos veröffentlicht, weil man hofft, dass diese Fähigkeiten auch per API breit genutzt werden und damit Geld einbringen.
    • Denn alle Demos sind Showcases dafür, wie sich Geminis Funktionen auf Code-Ebene zusammen mit anderen Google-APIs in Web-Apps umsetzen lassen.

Analyse der Demo-Prompts und des Codes

Ich habe mir zwei komplexere Beispiele angesehen.

Video Toys: Videos verstehen und erklären + Beispiel für Vibe Coding

  • Eine Demo, die ein YouTube-Video mit Gemini 2.5 analysiert und daraus per Vibe Coding eine einfache interaktive Lernmaterial-App erstellt.
    • Das Video wird dabei aus der Perspektive eines „Pädagogen und Produktdesigners mit Expertise darin, Lernerfahrungen als interaktive Web-App zu gestalten“ analysiert, anschließend wird eine Spezifikation für die Web-App erstellt und danach umgesetzt.
  • Beim Beispielvideo wurde der Inhalt bereits analysiert, sodass sich die Lernmaterial-App direkt ausprobieren lässt.
  • Anders als andere Demo-Apps, die aus nur wenigen Dateien bestehen, ist diese mit React aufgebaut.
  • Nutzer können sowohl die von Gemini erzeugte Spezifikation für das Vibe Coding als auch den erzeugten Code selbst bearbeiten.
  • Empfehlenswert für alle, die Services auf Basis von Videos oder zur Codegenerierung bauen möchten.

Maps Planner: Beispiel für Multimodalität + Function Calling + strukturierte Ausgabe + Maps API

  • Gibt man einen Ortsnamen ein, erklärt die Demo diesen Ort; schaltet man den Day Planner Mode ein, erstellt sie einen Tagesreiseplan. Auch die Reisezeiten werden geschätzt.
  • Sowohl General Explorer Mode als auch Day Planner Mode werden mit einem einzigen System-Prompt unterstützt.
    • Beeindruckend ist, dass der System-Prompt je nach gewähltem Modus des Nutzers subtil angepasst wird.
  • Es werden Funktionen definiert, mit denen Kartendaten präzise ein- und ausgegeben und Linien zwischen zwei Orten korrekt gezeichnet werden können, die Gemini dann aufruft.
    • Solche Erweiterbarkeit ist vermutlich genau das, was man mit MCP erreichen möchte.
  • Nicht nur die Prompts sind gut, auch der Umgang mit Maps API und Positionsdaten ist sauber gezeigt. Empfehlenswert für alle, die Services rund um Karten bauen möchten.

Selbst etwas bauen

  • Demo-Apps lassen sich kopieren und anpassen. Es gibt auch viele Templates für Leute, die ganz von vorn anfangen.
  • Ich habe die Bildgenerierungs-Demo Explain Things with Lots of Tiny Cats kopiert und meine eigene Version gebaut.
    • Wenn man um eine Erklärung zu einem Konzept bittet, erzeugt die Demo mit Metaphern aus vielen Katzen eine Art Webtoon.
    • Eindrucksvoll waren der Prompt, der fortlaufend Bildgenerierung auslöst (No commentary, just begin your explanation. Keep going until you're done.), sowie der Code, der die so erzeugten Bilder einzeln als Stream anzeigt.
  • Ich habe daraus eine koreanische Version mit Nilpferden gemacht: Nilpferde wissen alles.
    • Dafür habe ich eine passende koreanische Schrift von Google Fonts geholt und HTML-Code sowie Prompt leicht angepasst.
  • Es gibt zwar eine Funktion zum Teilen der eigenen App, sie funktioniert aber nicht gut.
    • Da alle zugehörigen Dateien in Google Drive gespeichert werden, kann man stattdessen einfach wie beim Teilen normaler Dateien in Google Drive vorgehen.

Gemini Cookbook

  • Während die Starter Apps eher unterhaltsame Beispiele für Web-Apps sind, gibt es dort viele verschiedene Python-Beispiele.
    • Auch Beispiele für das erst vor wenigen Stunden veröffentlichte Gemini 2.5 Flash sind enthalten.
  • Gut geeignet als Referenz für alle, die generative-AI-Services entwickeln möchten.

Noch keine Kommentare.

Noch keine Kommentare.