Feinabstimmung von Mistral 7B beim Draft in Magic: The Gathering
(generallyintelligent.substack.com)Zusammenfassung: Untersuchung der Fine-Tuning-Technik für künstliche Intelligenz
- Wirkung und Schwierigkeit von Fine-Tuning
- Fine-Tuning ergänzt die Fähigkeiten von GPT-4 und verspricht mehr Geschwindigkeit sowie bessere Kosteneffizienz.
- Um den Mangel an Informationen darüber zu beheben, wie effektiv und schwierig Fine-Tuning in der Praxis wirklich ist, wurde ein eigenes Experiment durchgeführt.
Auswahl des Problems
- Test der Schlussfolgerungsfähigkeit des Modells anhand von Magic: The Gathering (MTG)-Drafts
- MTG ist ein strategisches Kartenspiel; beim Draft werden aus einem zufälligen Kartenpool Karten ausgewählt, um ein Deck zusammenzustellen.
- Draft eignet sich als komplexe Aufgabe, die Schlussfolgern und das Verständnis neuer Daten erfordert.
- Große historische Datensätze des Dienstes 17lands wurden genutzt, wobei die Draft-Entscheidungen der besten Spieler als „ground truth“ dienten.
Ergebnisse und Zusammenfassung
- Leistung des feinabgestimmten 7B-Modells
- Das feinabgestimmte 7B-Modell übertrifft GPT-4 und erreicht nahezu menschliches Niveau.
- Fine-Tuning von GPT-3.5 könnte noch bessere Ergebnisse liefern, ist jedoch sehr teuer.
- Fine-Tuning ist weiterhin ein experimenteller Prozess, insbesondere weil Prompt Engineering viel Zeit beansprucht.
- Nach dem Fine-Tuning auf neue Kartensets zeigte das Modell Generalisierungsfähigkeit auch auf ungesehenen Kartensets.
Praxisbericht: Methode und Lernprozess
- Datenaufbau
- CSV-Daten von 17lands wurden in ein Textformat umgewandelt, das sich für Fine-Tuning eignet.
- Die Formatierung der Daten war anspruchsvoll und experimentell.
- Durchführung des Fine-Tunings
- Wegen eingeschränktem GPU-Zugang wurden bei Runpod GPUs stundenweise gemietet.
- Mit axolotl ließ sich die Optimierung für Fine-Tuning einfach umsetzen.
- Evaluierung
- Es ist wichtig, die Bewertungskriterien vor Beginn des Experiments festzulegen.
- Die Definition geeigneter Evaluierungsmaßstäbe für Sprachmodelle kann schwierig sein.
Zentrale Erkenntnisse
- Wirkung von Fine-Tuning
- Fine-Tuning auf neue Daten ist in Bezug auf Genauigkeit und Kosten GPT-4 überlegen.
- Fine-Tuning erfordert, um es richtig umzusetzen, einen experimentellen Prozess und ist eine spezielle Fähigkeit, die schwerer zu erlernen ist als Prompt Engineering.
Zusätzliche Informationen zu Magic
- Leistung des feinabgestimmten KI-Draft-Bots
- Es wurde eine Draft-Hilfs-App entwickelt, die ein mit Magic Arena-Logs verbundenes Draft-Modell verwendet.
- Das feinabgestimmte Modell erzeugt die Auswahlentscheidungen, während GPT-4 die Erklärungen liefert.
- Durch die Simulation mehrerer KI-Draft-Bots zeigte sich eine Leistung ähnlich der menschlicher Drafters.
Meinung von GN⁺
Der wichtigste Punkt dieses Artikels ist, dass Fine-Tuning das Potenzial hat, die Leistung bestehender großer Sprachmodelle wie GPT-4 zu übertreffen und damit das Verständnis sowie die Effizienz von künstlicher Intelligenz bei spezifischen Aufgaben deutlich zu verbessern. Interessant ist der Beitrag, weil er anhand eines realen Anwendungsfalls den konkreten Prozess des Fine-Tunings und dessen Wirkung zeigt; das kann auch Einsteigerinnen und Einsteigern im Software Engineering helfen, die Entwicklungsmöglichkeiten von KI-Technologien und ihre Anwendung besser zu verstehen.
1 Kommentare
Hacker-News-Kommentar