g1 – Erzeugung einer o1-ähnlichen Reasoning-Kette mit Llama-3.1 70B auf Groq
(github.com/bklieger-groq)- g1 ist ein früher Prototyp, der Prompt-Strategien nutzt, um die Reasoning-Fähigkeiten von LLMs zu verbessern
- Dadurch können LLMs logische Probleme lösen und Aufgaben bewältigen, mit denen bestehende Modelle Schwierigkeiten haben
- g1 wurde als Open Source veröffentlicht, um die Open-Source-Community dazu zu inspirieren, neue Strategien zu entwickeln
Funktionsweise
- g1 verwendet Llama3.1-70b, um eine dynamische Chain of Thought zu erzeugen.
- In jedem Schritt kann das LLM entweder zum nächsten Reasoning-Schritt übergehen oder eine endgültige Antwort liefern.
- Der System-Prompt enthält Tipps für das LLM.
- Dazu gehören zum Beispiel Anweisungen wie „alternative Antworten erkunden“ und „mindestens 3 Methoden verwenden, um zur Antwort zu gelangen“.
- Mit diesen Methoden werden die Reasoning-Fähigkeiten des LLM verbessert.
Beispiele
- g1 kann einfache Logikprobleme mit einer Genauigkeit von 60–80 % lösen.
- Beispiel: Auf die Frage „Wie viele R gibt es in
strawberry?“ erreicht g1 eine Genauigkeit von 70 %.
Schnellstart
-
Verwendung der Streamlit-UI:
python3 -m venv venv source venv/bin/activate pip3 install -r requirements.txt export GROQ_API_KEY=gsk... streamlit run app.py -
Verwendung der Gradio-UI:
cd gradio pip3 install -r requirements.txt python3 app.py
Prompt-Strategie
-
Prompt-Beispiel:
{ "title": "Identifying Key Information", "content": "To begin solving this problem, we need to carefully examine the given information and identify the crucial elements that will guide our solution process. This involves...", "next_action": "continue" } -
Aufbau des Prompts:
- Zuweisung der Rolle eines Experten-AI-Assistenten
- Bereitstellung von Titel und Inhalt für jeden Schritt
- Antwort im JSON-Format
- Verwendung von mindestens 3 oder mehr Reasoning-Schritten
- Berücksichtigung der Grenzen des LLM und Einbeziehung der Erkundung alternativer Antworten
- Bei einer Überprüfung tatsächlich einen anderen Ansatz verwenden
Wichtige Forks
- Mult1: Erzeugt eine o1-ähnliche Reasoning-Kette mit mehreren AI-Anbietern (GitHub Repository)
Credits
- Diese App wurde von Benjamin Klieger entwickelt
Zusammenfassung von GN⁺
- g1 ist ein früher Prototyp, der Prompt-Strategien nutzt, um die Reasoning-Fähigkeiten von LLMs zu verbessern.
- Es wurde als Open Source veröffentlicht, um die Open-Source-Community dazu zu inspirieren, neue Strategien zu entwickeln.
- g1 zeigt beim Lösen einfacher Logikprobleme eine höhere Genauigkeit als bestehende Modelle.
- Dieser Artikel ist nützlich, um verschiedene Methoden zur Verbesserung der Reasoning-Fähigkeiten von LLMs zu untersuchen.
- Ein anderes Projekt mit ähnlicher Funktionalität ist OpenAIs o1.
1 Kommentare
Hacker-News-Kommentar
ollama:8bzu 100 % lokal läuft