34 Punkte von xguru 2023-06-01 | 2 Kommentare | Auf WhatsApp teilen
  • Vortrag von Andrej Karpathy auf der Build 2023
  • Besteht aus zwei Teilen
    • Wie man einen (Chat)GPT-Assistenten trainiert
    • Wie man diesen Assistenten in die eigene Anwendung integriert
  • Breite Erläuterung zu Tokenization, Pretraining, Supervised Finetuning, Reinforcement Learning from Human Feedback usw.,
    außerdem eine Einführung in Prompt-Strategien, verschiedene Ecosystem-Tools und zukünftige Erweiterungen

2 Kommentare

 
kuroneko 2023-06-01

Wenn man es zusammenfasst, kommt etwa Folgendes heraus.

  • Große Sprachmodelle wie GPT werden durch eine Vortrainingsphase auf großen Textmengen und durch Fine-Tuning trainiert, das auf bestimmte Aufgaben zugeschnitten ist.
  • Das Vortraining umfasst die Vorhersage des nächsten Wortes in einer Sequenz, um allgemeine Sprachrepräsentationen zu erlernen. Fine-Tuning passt das Modell an spezifische Aufgaben an.
  • Prompting kann ebenfalls verwendet werden, um Sprachmodelle ohne Fine-Tuning auf Aufgaben anzuwenden, indem dem Modell ein Prompt gegeben wird, damit es eine Antwort erzeugt.
  • Beim überwachten Fine-Tuning wird ein Assistentenmodell mit gelabelten Daten aus Prompts und idealen Antworten trainiert.
  • Die Leistung kann weiter verbessert werden, indem Reinforcement Learning from Human Feedback eingesetzt wird, um das Assistentenmodell so zu trainieren, dass es Antworten erzeugt, die von Menschen hoch bewertet werden.
  • Prompt-Engineering-Techniken, die dem Modell den Lösungsweg Schritt für Schritt zeigen oder Beispiele geben, können die Leistung von Sprachmodellen verbessern.
  • Sprachmodellen fehlen der innere Monolog und die Schlussfolgerungsfähigkeit des Menschen, weshalb Prompting dies ausgleichen muss.
  • Die Leistung kann verbessert werden, wenn Sprachmodellen Zugriff auf externe Werkzeuge, Rechner und Wissensdatenbanken gegeben wird.
  • Für bestimmte Aufgaben Teile des Sprachmodells feinzujustieren, kann die Leistung erhöhen, ist jedoch komplexer.
  • Es bestehen weiterhin verschiedene Einschränkungen von Sprachmodellen, darunter Verzerrungen, Denkfehler und Anfälligkeit für Angriffe.
 
xguru 2023-06-01

https://www.youtube.com/watch?v=bZQun8Y4L2A
Dasselbe Video gibt es auch auf YouTube, aber auf der Microsoft-Website werden KI-übersetzte koreanische Untertitel unterstützt, daher poste ich es dort.