DSPy – ein Framework, um Sprachmodelle zu programmieren (statt nur zu prompten)

xguru · 2024-12-12T10:23:01+09:00

DSPy (Declarative Self-improving Python) ist ein Framework, das dafür entwickelt wurde, Sprachmodelle (LMs) per Programmierung zu steuern Damit lassen sich modulare KI-Systeme schnell aufbauen – von einfachen Klassifikatoren über komplexe RAG-Pipelines bis hin zu Agenten-Loop-Systemen – und es bietet außerdem Algorithmen zur Optimierung von Prompts und Gewichten Statt fragiler Prompts schreibt man kombinierbaren Python-Code, um modulare KI-Systeme schnell zu erstellen und LMs darauf zu trainieren, hochwertige Ausgaben zu erzeugen Mit Module wird KI-Verhalten als Code statt als String beschrieben Um zuverlässige KI-Systeme zu bauen, muss man schnell iterieren können Die Pflege von Prompts ist jedoch schwierig, weil bei jeder Änderung von LM, Metrik oder Pipeline Strings oder Daten angepasst werden müssen DSPy wurde entwickelt, um die Definition von LM-Systemen von komplexen Entscheidungen über ein bestimmtes LM oder eine bestimmte Prompting-Strategie zu entkoppeln Der Programmieransatz von DSPy DSPy verlagert den Fokus von der Anpassung einzelner Prompt-Strings hin zu Programmierung mit strukturierten, deklarativen Natural-Language-Modulen Für alle KI-Komponenten eines Systems werden Ein-/Ausgabeverhalten als Signaturen festgelegt und per Auswahl von Modulen Strategien für LM-Aufrufe zugewiesen DSPy erweitert Signaturen zu Prompts und parst typisierte Ausgaben, sodass sich leicht nutzbare, portable und optimierbare KI-Systeme schreiben lassen Der Optimizer passt Prompts und Gewichte von KI-Modulen an DSPy bietet Werkzeuge, die High-Level-Code mit natürlichsprachlichen Annotationen in Low-Level-Operationen, Prompts oder Gewichts-Updates kompilieren Dadurch lassen sich LMs an die Struktur und die Metriken des Programms anpassen Wenn Code oder Metriken geändert werden, kann einfach erneut passend kompiliert werden Der Optimierungsprozess in DSPy Wenn einige Dutzend oder einige Hundert repräsentative Eingaben für die Aufgabe sowie eine Metrik zur Messung der Qualität der Systemausgaben vorhanden sind, kann der DSPy Optimizer verwendet werden dspy.BootstrapRS synthetisiert gute Few-Shot-Beispiele für alle Module dspy.MIPROv2 schlägt bessere natürlichsprachliche Anweisungen für alle Prompts vor und durchsucht den Raum intelligent dspy.BootstrapFinetune erstellt Datensätze für Module und nutzt sie, um die LM-Gewichte des Systems feinzujustieren Das DSPy-Ökosystem treibt Open-Source-KI-Forschung voran Das modulare Paradigma von DSPy bietet – verglichen mit großen Sprachmodellen selbst – mehr Forschenden die Möglichkeit, die zusammengesetzte Architektur von LM-Programmen, Inference-Time-Strategien und Optimierungswerkzeuge dezentral weiterzuentwickeln Das gibt DSPy-Nutzern mehr Kontrolle, hilft ihnen, schneller zu iterieren, und ermöglicht es, Programme mit aktuellen Optimierungswerkzeugen oder Modulen so weiterzuentwickeln, dass sie mit der Zeit besser werden Die DSPy-Forschung begann im Februar 2022 bei Stanford NLP und basiert auf Erkenntnissen aus der frühen Entwicklung zusammengesetzter LM-Systeme wie ColBERT-QA, Baleen und Hindsight Die erste Veröffentlichung erfolgte im Dezember 2022 als DSP, im Oktober 2023 entwickelte es sich zu DSPy weiter; dank 250 Beitragenden konnten Zehntausende lernen, wie modulare LM-Programme aufgebaut und optimiert werden Die DSPy-Community erzielte zahlreiche Forschungsergebnisse zu Optimierungswerkzeugen wie MIPROv2, BetterTogether und LeReT sowie zu Programmarchitekturen wie STORM, IReRa und DSPy Assertions Es gibt außerdem viele erfolgreiche Anwendungen auf neue Problemfelder, etwa PAPILLON, PATH, WangLab@MEDIQA, Prompting-Fallstudien der UMD und das Red-Teaming-Programm von Haize Darüber hinaus wird die Praxistauglichkeit von DSPy durch viele Open-Source-Projekte, Produktionsanwendungen und weitere Use Cases belegt

(dspy.ai)

9 Punkte von xguru 2024-12-12 | Noch keine Kommentare. | Auf WhatsApp teilen

DSPy (Declarative Self-improving Python) ist ein Framework, das dafür entwickelt wurde, Sprachmodelle (LMs) per Programmierung zu steuern
Damit lassen sich modulare KI-Systeme schnell aufbauen – von einfachen Klassifikatoren über komplexe RAG-Pipelines bis hin zu Agenten-Loop-Systemen – und es bietet außerdem Algorithmen zur Optimierung von Prompts und Gewichten
Statt fragiler Prompts schreibt man kombinierbaren Python-Code, um modulare KI-Systeme schnell zu erstellen und LMs darauf zu trainieren, hochwertige Ausgaben zu erzeugen
Mit Module wird KI-Verhalten als Code statt als String beschrieben
- Um zuverlässige KI-Systeme zu bauen, muss man schnell iterieren können
- Die Pflege von Prompts ist jedoch schwierig, weil bei jeder Änderung von LM, Metrik oder Pipeline Strings oder Daten angepasst werden müssen
- DSPy wurde entwickelt, um die Definition von LM-Systemen von komplexen Entscheidungen über ein bestimmtes LM oder eine bestimmte Prompting-Strategie zu entkoppeln
- Der Programmieransatz von DSPy
  - DSPy verlagert den Fokus von der Anpassung einzelner Prompt-Strings hin zu Programmierung mit strukturierten, deklarativen Natural-Language-Modulen
  - Für alle KI-Komponenten eines Systems werden Ein-/Ausgabeverhalten als Signaturen festgelegt und per Auswahl von Modulen Strategien für LM-Aufrufe zugewiesen
  - DSPy erweitert Signaturen zu Prompts und parst typisierte Ausgaben, sodass sich leicht nutzbare, portable und optimierbare KI-Systeme schreiben lassen
Der Optimizer passt Prompts und Gewichte von KI-Modulen an
- DSPy bietet Werkzeuge, die High-Level-Code mit natürlichsprachlichen Annotationen in Low-Level-Operationen, Prompts oder Gewichts-Updates kompilieren
- Dadurch lassen sich LMs an die Struktur und die Metriken des Programms anpassen
- Wenn Code oder Metriken geändert werden, kann einfach erneut passend kompiliert werden
- Der Optimierungsprozess in DSPy
  - Wenn einige Dutzend oder einige Hundert repräsentative Eingaben für die Aufgabe sowie eine Metrik zur Messung der Qualität der Systemausgaben vorhanden sind, kann der DSPy Optimizer verwendet werden
    - dspy.BootstrapRS synthetisiert gute Few-Shot-Beispiele für alle Module
    - dspy.MIPROv2 schlägt bessere natürlichsprachliche Anweisungen für alle Prompts vor und durchsucht den Raum intelligent
    - dspy.BootstrapFinetune erstellt Datensätze für Module und nutzt sie, um die LM-Gewichte des Systems feinzujustieren
Das DSPy-Ökosystem treibt Open-Source-KI-Forschung voran
- Das modulare Paradigma von DSPy bietet – verglichen mit großen Sprachmodellen selbst – mehr Forschenden die Möglichkeit, die zusammengesetzte Architektur von LM-Programmen, Inference-Time-Strategien und Optimierungswerkzeuge dezentral weiterzuentwickeln
- Das gibt DSPy-Nutzern mehr Kontrolle, hilft ihnen, schneller zu iterieren, und ermöglicht es, Programme mit aktuellen Optimierungswerkzeugen oder Modulen so weiterzuentwickeln, dass sie mit der Zeit besser werden
- Die DSPy-Forschung begann im Februar 2022 bei Stanford NLP und basiert auf Erkenntnissen aus der frühen Entwicklung zusammengesetzter LM-Systeme wie ColBERT-QA, Baleen und Hindsight
- Die erste Veröffentlichung erfolgte im Dezember 2022 als DSP, im Oktober 2023 entwickelte es sich zu DSPy weiter; dank 250 Beitragenden konnten Zehntausende lernen, wie modulare LM-Programme aufgebaut und optimiert werden
- Die DSPy-Community erzielte zahlreiche Forschungsergebnisse zu Optimierungswerkzeugen wie MIPROv2, BetterTogether und LeReT sowie zu Programmarchitekturen wie STORM, IReRa und DSPy Assertions
- Es gibt außerdem viele erfolgreiche Anwendungen auf neue Problemfelder, etwa PAPILLON, PATH, WangLab@MEDIQA, Prompting-Fallstudien der UMD und das Red-Teaming-Programm von Haize
- Darüber hinaus wird die Praxistauglichkeit von DSPy durch viele Open-Source-Projekte, Produktionsanwendungen und weitere Use Cases belegt

DSPy – ein Framework, um Sprachmodelle zu programmieren (statt nur zu prompten)

Verwandte Beiträge

Noch keine Kommentare.