ONE-PEACE: Allgemeines Repräsentationsmodell für unbegrenzte Multimodalität
(github.com/OFA-Sys)- Ein General Representation Model, das Vision-, Audio- und Sprachmodalitäten umfassend abdeckt
- Erzielt auch ohne vortrainierte Modelle hervorragende Ergebnisse bei integrierten Aufgaben
- Ermöglicht mit starkem emergentem Zero-shot Retrieval die Ausrichtung von Modalitäten, die in den Trainingsdaten nicht gepaart sind
- Audio-to-Image, Audio+Text-to-Image, Audio+Image-to-Image
1 Kommentare
Sieht so aus, als hätte es bei vielen Tasks den SOTA-Stand übertroffen.