2 Punkte von kiyeonjeon21 20 일 전 | Noch keine Kommentare. | Auf WhatsApp teilen

Hallo.

In letzter Zeit experimentiere ich damit, wie weit sich Videoarbeit mit Coding-Agenten wie Codex / Claude Code / Cursor treiben lässt, und baue dabei ein CLI namens VibeFrame.

Bei bestehenden Video-Tools hatte ich oft das Gefühl, dass der Status größtenteils in der UI steckt und daher für Agenten schwer zu handhaben ist. Deshalb entwickle ich es in die Richtung, Videoprojekte so weit wie möglich wie Code-Projekte zu behandeln.

Der grundlegende Ablauf sieht so aus.

  • STORYBOARD.md: Szenen, Narration, Timing, Cues zur Bild-/Videoerzeugung
  • DESIGN.md: Tonalität, Layout, Typografie, Bewegungsrichtung
  • vibe build: Asset-Erzeugung + Scene Composition
  • vibe render: MP4-Rendering
  • vibe inspect: Prüfung des Render-Ergebnisses

In der Praxis wird es etwa so verwendet.

curl -fsSL https://vibeframe.ai/install.sh | bash  
vibe setup --scope project  
vibe init launch --from brief.md  
  
# Codex / Claude Code / Cursor usw. anweisen,  
# STORYBOARD.md und DESIGN.md auf Basis der Recherche zu aktualisieren  
  
vibe build launch --dry-run  
vibe build launch  
vibe render launch  
vibe inspect render launch --cheap  

Der Bereich Scene Composition ist stark von den Ideen von Hyperframes beeinflusst. Dabei werden Videoszenen als HTML/CSS/JS-Komposition auf einer Timeline betrachtet, im Browser deterministisch erfasst und anschließend als MP4 gerendert.

VibeFrame ist eher darauf ausgerichtet, darüber eine Projektebene zu legen, mit der Coding-Agenten gut arbeiten können. STORYBOARD.md / DESIGN.md dienen als Source of Truth, dazu kommen agentische Workflows wie Multi-Provider-Erzeugung von Bildern/Videos/Narration/Musik, FFmpeg-basiertes Edit/Remix, JSON-Ausgabe, Dry-Run, projektbezogene Konfiguration und Inspect-Reports.

In dieser Demo wurde nach vibe setup --scope project und nur mit vibe init launch als Ausgangspunkt der Ablauf aufgezeichnet, bei dem ein Coding-Agent ein bestimmtes Thema recherchiert, anschließend STORYBOARD.md / DESIGN.md aktualisiert und schließlich inklusive Bildgenerierungs-Cues bis zur finalen MP4 baut.

Video des vollständigen Prozesses:
https://t.co/YD0SYyODcQ

Da alles noch in einem frühen Stadium ist, interessiert mich besonders Feedback zu den folgenden Punkten.

  • Ob es natürlich wirkt, STORYBOARD.md + DESIGN.md als Agenten-Interface für Videoarbeit zu verwenden
  • Ob die Trennung in die drei Workflow-Lanes build / generate / edit-remix leicht verständlich ist
  • Ob die CLI-Oberfläche zu breit ist oder umgekehrt Funktionen zu fehlen scheinen

Es ist der Versuch, Videobearbeitung nicht als GUI, sondern als agentisches CLI zu denken, und ich würde gern Meinungen von Leuten hören, die ähnliche Probleme erlebt haben.

Noch keine Kommentare.

Noch keine Kommentare.