YaLM 100B - GPT-ähnliches Sprachmodell mit 100 Milliarden Parametern
(github.com/yandex)- Von Yandex veröffentlicht und für Entwickler/Forscher kostenlos nutzbar
- Mit 1,7 TB englischem und russischem Text 65 Tage lang auf 800 A100-GPUs trainiert
- Basierend auf dem Megatron-LM-Code von Microsoft
Noch keine Kommentare.