- Das erste Foundation Model für „Bildsegmentierung“
- Dabei wird identifiziert, zu welchem Objekt ein Pixel gehört
- SAM und der Datensatz SA-1B mit 1 Milliarde Parametern wurden veröffentlicht
- SAM hat ein allgemeines Konzept davon gelernt, was ein Objekt ist, und kann daher Masken für alle Objekte in Bildern/Videos erzeugen – auch für Objekte und Bildtypen, denen es während des Trainings nicht begegnet ist
- Lässt sich auch ohne zusätzliches Training auf neue Bilddomänen anwenden, etwa Unterwasserfotos oder mikroskopische Zellaufnahmen
7 Kommentare
Meta, wow ..
Cool, Meta~
Wow … einfach krass …
Wow … die Erkennung der Objekte ist ja unglaublich schnell, sobald man den Raum betritt ;;.. Die Zukunft, in der sich eine AR-Welt entfaltet, wird der Hammer.
Die blickbasierte Erkennung ist wirklich unglaublich.
Ich habe drei Jahre lang im Bereich Bildsegmentierung gearbeitet, und das ist wirklich beeindruckend.
Wenn Sie den letzten Abschnitt „What lies Ahead“ im vorgestellten Blogbeitrag lesen, verstehen Sie, warum dieses Modell wichtig ist.
Es wirkt wie eine Basistechnologie für jene Filmszenen, in denen ein AR/MR-Headset das Objekt erkennt, das man gerade sieht, es umrandet und erklären kann.
Introducing Segment Anything: Working toward the first foundation model for image segmentation
Nach LLaMA scheint Meta erneut ein Modell veröffentlicht zu haben, das dem KI-Bereich sehr zugutekommt … gut gemacht!