Bildsuche mit Marqo, yolox, CLIP und OWL-ViT durch Lokalisierung und Open-Vocabulary-Reranking

(github.com/marqo-ai)

1 Punkte von marqoskelts 2022-12-16 | Noch keine Kommentare. | Auf WhatsApp teilen

Kurzfassung: Hier wird gezeigt, wie sich die Bildsuche mit Marqo, yolox, CLIP und OWL-ViT weiterentwickeln lässt, indem Lokalisierung und Reranking hinzugefügt werden. Das Hinzufügen einer zusätzlichen Dimension der Lokalisierung kann die Suchleistung verbessern, neue Anwendungsfälle für die Bildsuche ermöglichen und zugleich die Erklärbarkeit erhöhen. Das erneute Ranken mit einem Open-Vocabulary-Detektionsmodell ermöglicht eine feinere Lokalisierung. Der erste Teil des Artikels behandelt Hintergrundinformationen, der zweite Teil enthält lauffähigen Code (der auch hier zu finden ist).

Bildsuche mit Marqo, yolox, CLIP und OWL-ViT durch Lokalisierung und Open-Vocabulary-Reranking

Verwandte Beiträge

Noch keine Kommentare.