9 Punkte von xguru 2022-12-10 | 1 Kommentare | Auf WhatsApp teilen
  • Still per Commit auf GitHub veröffentlicht
  • Wurde mit mehr Epochs* zusammen mit Normalisierung trainiert und zeigt im Vergleich zum vorherigen Modell eine verbesserte Leistung
  • Gleiche Architektur wie bisher
  • Beim Aufruf von load_model("large") wird das Modell large-v2 geladen
  • Ein Paper zu diesem Modell soll in Kürze veröffentlicht werden
  • Epoch: Alle im Trainingsdatensatz enthaltenen Daten durchlaufen das Modell jeweils einmal (Forward Pass/Backward Pass). Also die Einheit für einen vollständigen Lerndurchlauf über den gesamten Datensatz