DeepSpeed Chat – Framework zum Trainieren ChatGPT-ähnlicher Modelle mit RLHF
(github.com/microsoft)- Schnelles, kostengünstiges und skalierbares offenes System-Framework
- Ermöglicht die Erstellung hochwertiger Modelle im ChatGPT-Stil jeder Größenordnung durch End-to-End-RLHF (Reinforcement Learning from Human Feedback)
- Mit 1 Klick können ein ChatGPT-Modell mit 1,3B Parametern auf einer einzelnen NVIDIA-A6000-GPU mit 48 GB Speicher in 1,36 Stunden trainiert, erzeugt und bereitgestellt werden
- Wird unter anderem von Databricks Dolly, CarperAI-TRLX und Huggingface-PEFT genutzt
1 Kommentare
DeepSpeed – die von Microsoft veröffentlichte Bibliothek zur Optimierung von Deep Learning
Databricks veröffentlicht mit Dolly 2.0 ein ChatGPT-ähnliches Modell als Open Source