- Segment Anything Model 2 ist ein Modell zur Lösung promptbarer visueller Segmentierungsprobleme in Bildern und Videos
- Es erweitert den Ansatz auf Videos, indem Bilder als Videos mit einem einzelnen Frame betrachtet werden
- Verwendet eine einfache Transformer-Architektur mit Streaming-Speicher für die Videoverarbeitung in Echtzeit
- Es wurde eine Daten-Engine aufgebaut, die Modell und Daten durch Benutzerinteraktionen verbessert, um den SA-V-Datensatz zu sammeln
- Bietet starke Leistung über verschiedene Aufgaben und visuelle Domänen hinweg
- Der Segment Anything Video (SA-V)-Datensatz wurde ebenfalls veröffentlicht
- Besteht aus 50.583 vielfältigen Videos und 642.036 hochwertigen raumzeitlichen Segmentierungsmasken (Masklets)
- CC BY 4.0-Lizenz
2 Kommentare
Segment Anything Model (SAM): Metas KI-Modell, das beliebige Objekte aus Bildern extrahiert
SAM.cpp – Implementierung von Metas Segment Anything Model in reinem C/C++
Hacker-News-Kommentare
Interessiert an der 6-fachen Verbesserung bei mIoU und Bildverarbeitungsgeschwindigkeit
Das Segment Anything-Team hat das Modell SAM 2 veröffentlicht
Habe mich schon einmal mit SAM 1 beschäftigt
Ich möchte ein Modell trainieren, das Videoframes klassifiziert und bestimmte Frames findet
Großer Fan der SAM-Loss-Funktion
Die Web-Demo ist sehr sauber gemacht
Das erste SAM-Modell war am nützlichsten
Die Forschungsdemo ist in Illinois und Texas nicht verfügbar
Es gibt Bedenken hinsichtlich militärischer Nutzung
Beeindruckende Leistung