- Gesamter Quellcode, Modellgewichte und Trainingsdatensätze unter Apache-2.0 veröffentlicht
- Vier Hauptkomponenten
- Instruction-Tuned LLM, feinabgestimmt auf Basis von GPT-NEOX-20B mit 43 Millionen Befehlssätzen
- Customization Recipe zur Feinabstimmung passend für eigene Aufgaben
- Erweiterbares Retrieval-System, das Antworten mit Informationen aus einer Dokument-Repo, APIs und Quellen anreichern kann, die sich zum Inferenzzeitpunkt in Echtzeit aktualisieren lassen
- Moderation Model, entwickelt durch Feinabstimmung von GPT-JT-6B, um Fragen zu filtern, auf die der Bot antworten soll
- Zusammenarbeit von LAION und Ontocord: OIG-Datensatz mit 43 Millionen Anweisungen (separat veröffentlicht)
Noch keine Kommentare.