- Auf HN ist das Interesse an der Feinabstimmung von Open-Source-LLMs stark gestiegen (z. B. durch den Beitrag von Anyscale)
- Es werden mehrere Jahre an Erfahrung und Erkenntnissen zur Modell-Feinabstimmung sowie praktischer Code geteilt
- Bereitgestellt wird ein Set von Notebooks zu Datenlabeling, Feinabstimmung, effizienter Inferenz-Ausführung sowie Kosten-/Leistungsbewertung
- Training eines 7B-Modells, das auf dem Testset zu 95 % mit den Labels von GPT-4 übereinstimmt
- Was ist Feinabstimmung? Eine stärkere Form des Promptings als das Formulieren von Anweisungen in Textform
- Ein bestehendes Modell wird mit Beispiel-Eingabe-/Ausgabe-Paaren für das Training feinabgestimmter Modelle trainiert
- Vor- und Nachteile von Prompting und Feinabstimmung
- Großer Vorteil der Feinabstimmung: deutlich effektiver beim Steuern des Modellverhaltens, sodass oft auch wesentlich kleinere Modelle ausreichen
- Ein feinabgestimmtes Llama-7B-Modell ist pro Token 50-mal günstiger als GPT-3.5 und liefert in vielen Anwendungsfällen gleich gute oder bessere Ergebnisse
- Beispiel: Die Klassifizierung von 2 Mio. Rezepten mit GPT-4 kostet 23.000 US-Dollar, während unser feinabgestimmtes Modell eine ähnliche Leistung wie GPT-4 zeigt und für die Ausführung auf dem gesamten Datensatz nur 19 US-Dollar kostet
- Es wird an einem Open-Source-Produkt namens OpenPipe gearbeitet
- Das Produkt OpenPipe soll Ingenieuren helfen, Feinabstimmung so einfach wie möglich einzusetzen
- Der vorliegende Beitrag teilt, was über Feinabstimmung gelernt wurde
1 Kommentare
Hacker-News-Kommentare