3 Punkte von xguru 2023-05-31 | 3 Kommentare | Auf WhatsApp teilen
  • General Representation Model, das Vision-, Audio- und Sprachmodalitäten umfassend abdeckt
  • Erzielt auch ohne vortrainierte Modelle hervorragende Ergebnisse bei integrierten Aufgaben
  • Ermöglicht mit starkem emergentem Zero-shot Retrieval die Ausrichtung von Modalitäten, die in den Trainingsdaten nicht gepaart waren
  • Audio-to-Image, Audio+Text-to-Image, Audio+Image-to-Image

3 Kommentare

 
ninebow 2023-05-31

Ups, das scheint dasselbe zu sein wie das, was Sie letzte Woche gepostet haben. +_+
https://de.news.hada.io/topic?id=9249

 
xguru 2023-05-31

Ups, da habe ich offenbar etwas Falsches kopiert, schluchz. Da es auch über Slack geteilt wurde, lasse ich es einfach so.
(Es ist wichtig, also schauen Sie es sich einfach zweimal an.. schluchz schluchz)

 
ninebow 2023-05-31

Ja, danke! 🙇🏼‍♂️
(Dadurch habe ich erfahren, dass xguru es direkt selbst gepostet hat! 🤣)