ImageBind – Metas multimodales KI-Modell
(imagebind.metademolab.com)- Bindet sechs Modalitäten von Daten gleichzeitig, auch ohne Supervision, um verschiedene Arten von Informationen besser zu analysieren
- Bilder, Videos, Audio, Text, Tiefe, Wärme (Thermal), IMU (Inertial Measurement Unit)
- Es ist möglich, Bilder auf Basis von Geräuschen zu erzeugen oder Informationen zu suchen, indem Audio-, Video-, Bild- und Tiefendaten kombiniert werden
- Hervorragende Zero-shot-/Few-shot-Erkennungsleistung
Noch keine Kommentare.