13 Punkte von xguru 2023-04-03 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Ein Sprachmodell mit 50 Milliarden (50B) Parametern, trainiert auf umfangreichen Finanzdaten
  • Aufbau eines Datensatzes mit 363 Milliarden Tokens auf Basis der Bloomberg-Datenquellen, ergänzt durch 345 Milliarden allgemeine Tokens
  • Keine Leistungseinbußen bei allgemeinen LLM-Benchmarks und in Finanzaufgaben deutlich bessere Leistung als bestehende Modelle
  • Erläuterung der Modellierungsentscheidungen, des Trainingsprozesses und der Evaluierungsmethodik
  • Als nächster Schritt ist die Veröffentlichung eines Training-Logs (Chronik) geplant, das die Trainingserfahrungen mit BloombergGPT ausführlich behandelt

Noch keine Kommentare.

Noch keine Kommentare.