2 Punkte von GN⁺ 2024-09-17 | 1 Kommentare | Auf WhatsApp teilen
  • g1 ist ein früher Prototyp, der Prompt-Strategien nutzt, um die Reasoning-Fähigkeiten von LLMs zu verbessern
  • Dadurch können LLMs logische Probleme lösen und Aufgaben bewältigen, mit denen bestehende Modelle Schwierigkeiten haben
  • g1 wurde als Open Source veröffentlicht, um die Open-Source-Community dazu zu inspirieren, neue Strategien zu entwickeln

Funktionsweise

  • g1 verwendet Llama3.1-70b, um eine dynamische Chain of Thought zu erzeugen.
  • In jedem Schritt kann das LLM entweder zum nächsten Reasoning-Schritt übergehen oder eine endgültige Antwort liefern.
  • Der System-Prompt enthält Tipps für das LLM.
  • Dazu gehören zum Beispiel Anweisungen wie „alternative Antworten erkunden“ und „mindestens 3 Methoden verwenden, um zur Antwort zu gelangen“.
  • Mit diesen Methoden werden die Reasoning-Fähigkeiten des LLM verbessert.

Beispiele

  • g1 kann einfache Logikprobleme mit einer Genauigkeit von 60–80 % lösen.
  • Beispiel: Auf die Frage „Wie viele R gibt es in strawberry?“ erreicht g1 eine Genauigkeit von 70 %.

Schnellstart

  • Verwendung der Streamlit-UI:

    python3 -m venv venv  
    source venv/bin/activate  
    pip3 install -r requirements.txt  
    export GROQ_API_KEY=gsk...  
    streamlit run app.py  
    
  • Verwendung der Gradio-UI:

    cd gradio  
    pip3 install -r requirements.txt  
    python3 app.py  
    

Prompt-Strategie

  • Prompt-Beispiel:

    {  
      "title": "Identifying Key Information",  
      "content": "To begin solving this problem, we need to carefully examine the given information and identify the crucial elements that will guide our solution process. This involves...",  
      "next_action": "continue"  
    }  
    
  • Aufbau des Prompts:

    • Zuweisung der Rolle eines Experten-AI-Assistenten
    • Bereitstellung von Titel und Inhalt für jeden Schritt
    • Antwort im JSON-Format
    • Verwendung von mindestens 3 oder mehr Reasoning-Schritten
    • Berücksichtigung der Grenzen des LLM und Einbeziehung der Erkundung alternativer Antworten
    • Bei einer Überprüfung tatsächlich einen anderen Ansatz verwenden

Wichtige Forks

  • Mult1: Erzeugt eine o1-ähnliche Reasoning-Kette mit mehreren AI-Anbietern (GitHub Repository)

Credits

  • Diese App wurde von Benjamin Klieger entwickelt

Zusammenfassung von GN⁺

  • g1 ist ein früher Prototyp, der Prompt-Strategien nutzt, um die Reasoning-Fähigkeiten von LLMs zu verbessern.
  • Es wurde als Open Source veröffentlicht, um die Open-Source-Community dazu zu inspirieren, neue Strategien zu entwickeln.
  • g1 zeigt beim Lösen einfacher Logikprobleme eine höhere Genauigkeit als bestehende Modelle.
  • Dieser Artikel ist nützlich, um verschiedene Methoden zur Verbesserung der Reasoning-Fähigkeiten von LLMs zu untersuchen.
  • Ein anderes Projekt mit ähnlicher Funktionalität ist OpenAIs o1.

1 Kommentare

 
GN⁺ 2024-09-17
Hacker-News-Kommentar
  • Die Chain-of-Thought-Methode ist simpel, Tree of Thoughts ist der ausgefeiltere Ansatz
    • Hinweise im Zusammenhang mit OpenAI beziehen sich auf Baumsuche
    • Wichtig ist, CoT als Baum aufzubauen und die optimale Lösung zu finden
  • Es ist lustig, Anweisungen durch GROSSBUCHSTABEN hervorzuheben
    • Die erste Person, die AGI zum Erfolg führt, wird einen Weg finden, die Zuverlässigkeit von LLMs zu erhöhen
  • Die Innovation von o1 ist nicht Chain-of-Thought, sondern dem Modell beizubringen, CoT gut auszuführen
    • Mit einfachem Prompt Engineering lässt sich die Leistung von o1 nicht erreichen
  • Ein LLM kann Probleme lösen, indem es die Eingabe unterschiedlich „vergrößert“
    • Man kann Text buchstabenweise eingeben oder in ein Bildformat umwandeln, um Details zu prüfen
  • Es macht etwas Ähnliches wie das Projekt optillm
    • Mit verschiedenen Optimierungstechniken lassen sich LLMs verbessern
  • Es wurde so geändert, dass es mit ollama:8b zu 100 % lokal läuft
    • Das Readme ist noch nicht aktualisiert
  • Es ist wichtig, eine Definition von „Schlussfolgern“ zu finden
    • Das Problem des Schlussfolgerns bei LLMs kann durch die Kombination mit klassischen Algorithmen gelöst werden
    • Man sollte den Denkprozess in zwei Teile aufteilen und auf geeigneten Modellen ausführen
  • Bei einem Prompt, der fragt, welche Zahl größer ist, .9 oder .11, wird geantwortet, dass .9 größer ist
    • Das ist nur ein einfacher System-Prompt
  • Aus Spaß wurde das Projekt geforkt, damit das Llama-3.1-7B-Modell lokal läuft
    • Das Erdbeerproblem kann es nicht lösen, aber es erkennt, dass 0.9 größer ist