7 Punkte von xguru 2023-07-03 | 1 Kommentare | Auf WhatsApp teilen
  • Open-Source-Implementierung des Flamingo-Modells von DeepMind
  • Modelle in 3B, 4B und 9B veröffentlicht
    • Basierend auf MPT-1B/7B und RedPajama-3B
  • Erzielt mehr als 80 % der Leistung des ursprünglichen Flamingo-Modells
  • Trainings- und Evaluierungscode verbessert
    • Unterstützung für Fully Sharded Data Parallel (FSDP)
    • Neue Datensätze (TextVQA, VizWiz, HatefulMemes, Flickr30k) zur Evaluierungs-Suite hinzugefügt