- Mit dem neuronalen Netzwerk CLIP von OpenAI nach bestimmten Szenen in Videos suchen
→ Bilder innerhalb des Videos durchsuchen, etwa nach "Road Works", "People crossing the street" oder "Fire truck"
Funktionsweise
-
YouTube-Video herunterladen
-
Einzelne Frames extrahieren
-
Alle Frames mit CLIP kodieren
-
Die Suchanfrage in natürlicher Sprache mit CLIP kodieren
-
Bestimmte Szenen per Suchanfrage in natürlicher Sprache finden
- Direkt als Notebook in Google Colab ausführbar
1 Kommentare
In den Kommentaren gibt es noch die Bildersuche von Unsplash desselben Entwicklers, ebenfalls mit CLIP umgesetzt; auch das dürfte sehr nützlich sein.
https://github.com/haltakov/natural-language-image-search
Google Colab: https://colab.research.google.com/github/haltakov/…
Es findet unter den 2 Millionen auf Unsplash hochgeladenen Fotos Bilder mit den gewünschten Inhalten.