Mistral-finetune – Mistral-Modelle feinjustieren
(github.com/mistralai)- Leichte Codebasis, die das speicher- und leistungseffiziente Feinjustieren von Mistral-Modellen ermöglicht
- Auf LoRA-Basis werden die meisten Gewichte eingefroren, und nur zusätzliche Gewichte in Form von 1–2 % Low-Rank-Matrix-Perturbation werden trainiert
- Für maximale Effizienz wird die Verwendung von A100- oder H100-GPUs empfohlen; die Codebasis ist für Multi-GPU-Training auf einem einzelnen Node optimiert, aber bei kleineren Modellen wie 7B reicht auch eine einzelne GPU aus
Hinweis: Das Ziel dieses Repositorys ist es, einen einfachen, anleitungsbasierten Einstiegspunkt für das Feinjustieren von Mistral-Modellen bereitzustellen. Daher ist es (insbesondere in Bezug auf die Datenformatierung) recht meinungsstark und zielt nicht darauf ab, umfassend über mehrere Modellarchitekturen oder Hardwaretypen hinweg zu sein. Für allgemeinere Ansätze lohnt sich ein Blick auf andere hervorragende Projekte wie torchtune.
Noch keine Kommentare.