2 Punkte von kmelon 2026-02-02 | Noch keine Kommentare. | Auf WhatsApp teilen

1. Kurzvorstellung

Hallo.
Ich bin der Solo-Entwickler, der letztes Mal den eBook-Reader (Folio) vorgestellt hat.

Bei der Videobearbeitung gibt es Momente, in denen man den Hintergrund ohne Chroma Key entfernen möchte,
oder aus Musik nur den Gesang oder nur ein bestimmtes Instrument extrahieren will.
Mit der Idee, Hintergrundentfernung und Audio-Separierung in einem einzigen Tool zu lösen, habe ich es selbst entwickelt.


2. Service in einem Satz

AlphaClip ist eine Desktop-App, die mit KI automatisch Hintergründe aus Videos entfernt und Audio in einzelne Spuren (Gesang, Drums, Bass, Gitarre usw.) auftrennen kann.


3. Servicevorstellung

AlphaClip (Habom) ist ein KI-Tool mit Fokus auf die Video-Postproduktion.

  • Automatische KI-basierte Hintergrundentfernung aus Videos (weißer oder schwarzer Hintergrund empfohlen)
  • Trennung von Audio in einzelne Spuren (Gesang, Drums, Bass, Gitarre usw.)
  • Saubere Hintergrundentfernung auch ohne Chroma-Key-Equipment
  • Die Hintergrundentfernungsfunktion von After Effects einfacher automatisieren

Es kann für die Erstellung von Charaktervideos, Musikbearbeitung und Video-Postproduktion genutzt werden.


4. Hauptfunktionen

🎬 Entfernung von Videohintergründen

  • KI-basierte automatische Hintergrundentfernung
  • Extraktion nur des Motivs ohne Chroma Key
  • Unterstützung für GPU(CUDA)-Beschleunigung zur Verbesserung der Verarbeitungsgeschwindigkeit

🎵 Audio-Separierung

  • Extraktion einzelner Spuren wie Gesang / Drums / Bass / Gitarre
  • In Musik kann gezielt nur das gewünschte Instrument getrennt werden

🎞️ Erstellung von Charaktervideos

  • Erzeugung des finalen Charaktervideos mit KI

5. Tech-Stack

  • Python (Entwicklung auf Basis von Vibe Coding)
  • CUDA (GPU-Beschleunigung)
  • KI-Modelle (Hintergrundentfernung / Audio-Separierung)

6. Schwierigkeiten während der Entwicklung

  • Optimierung der GPU-Nutzung über CUDA-Setup
  • Balance zwischen Qualität der Hintergrundentfernung und Verarbeitungsgeschwindigkeit
  • Umgang mit verbliebenen Fehlern, da die Entwicklung in der ersten Woche von Vibe Coding erfolgte

7. Aktueller Stand

  • Entwicklung seit etwa einer Woche mit Vibe Coding
  • Der Fokus liegt auf der Funktionsumsetzung, einige Fehler sind noch vorhanden
  • Vorläufig kostenlose Veröffentlichung und fortlaufende Verbesserungen geplant
  • Künftig geplant zur Erstellung von animierten Charakteren und Hintergründen (78 Karten) für eine Tarotkarten-App
  • Das endgültige Ziel ist es, kleine Projekte zu sammeln und daraus eine automatisierte Pipeline zu bauen

Da ich aktuell 2 bis 4 laufende Arbeiten gleichzeitig bearbeite, brauche ich wohl etwas mehr Auswahl und Fokus!
Kurz gesagt:

  1. RVC, also vereinfacht gesagt die Nutzung von speech-to-speech-Training/Inferenz zur Änderung von Charakterstimmen
  2. Auch die unten verlinkte Market-Seite hat etwa einen Monat gedauert und sogar die Bezahlfunktion ist fertig, aber weitere Verbesserungen sind geplant
  3. Ein Tool zur Verwaltung von App-Benachrichtigungen (APNs/FCM) sowie ein Funnel-Analysetool (ähnlich wie Google Analytics)

Es gibt noch mehr, aber auch wenn es Zeit braucht, werde ich sie nach und nach langsam vorstellen!!


8. Was ich mir wünsche

  • Echtes Feedback von Nutzern (Fehlermeldungen sind sehr willkommen!! Per Video oder über SNS jederzeit gern!)
  • Meinungen zu Video-Editing-Workflows

Wenn es Schwächen oder Verbesserungsideen gibt, sagt mir gern ganz offen Bescheid!
Ich würde mich freuen, wenn ihr das Video mit Spaß anschaut!


Mit diesem Programm habe ich das folgende Video erstellt — viel Spaß (?) beim Anschauen :)

Demo-Video

https://www.youtube.com/watch?v=lZhiMreW94Q

  • Das Tool zum CPU/GPU-Monitoring im Video habe ich ebenfalls im Market hochgeladen!!
    (Es ist beim Erstellen der AlphaClip/Habom-Tools in einer Pause(?) in nur 30 Minuten bis 1 Stunde entstanden!!)

⬇️ Download-Link
📥 Download: https://market.habom.kr

Noch keine Kommentare.

Noch keine Kommentare.