GPT4All – auf LLaMA basierender Chatbot, trainiert mit 800k Anweisungsdatensätzen

xguru · 2023-03-31T10:43:02+09:00

Assistant-Style-Großsprachenmodell Gesammelte Daten, Datenerfassungsprozess, Trainingscode, endgültige Modellgewichte usw. werden vollständig offengelegt Trainiert mit 800k von GPT 3.5 Turbo erzeugten Daten (Code/Story/Dialog) Nutzt LAION OIG, Coding-Fragen von Stack Overflow und Instruction-Tuning aus Big-Science/P3 als Basisdatensätze Referenziert unter anderem Stanford Alpaca; die Daten wurden in ATLAS hochgeladen und dort kuratiert sowie bereinigt

(github.com/nomic-ai)

19 Punkte von xguru 2023-03-31 | Noch keine Kommentare. | Auf WhatsApp teilen

Assistant-Style-Großsprachenmodell
Gesammelte Daten, Datenerfassungsprozess, Trainingscode, endgültige Modellgewichte usw. werden vollständig offengelegt
Trainiert mit 800k von GPT 3.5 Turbo erzeugten Daten (Code/Story/Dialog)
- Nutzt LAION OIG, Coding-Fragen von Stack Overflow und Instruction-Tuning aus Big-Science/P3 als Basisdatensätze
- Referenziert unter anderem Stanford Alpaca; die Daten wurden in ATLAS hochgeladen und dort kuratiert sowie bereinigt

GPT4All – auf LLaMA basierender Chatbot, trainiert mit 800k Anweisungsdatensätzen

Verwandte Beiträge

Noch keine Kommentare.