1 Punkte von GN⁺ 2025-04-30 | 1 Kommentare | Auf WhatsApp teilen
  • CoRT ist ein Algorithmus, der ein KI-Modell dazu bringt, seine eigenen Antworten wiederholt zu überprüfen, Alternativen zu erzeugen und die beste Antwort auszuwählen.
  • Bei Anwendung auf das Modell Mistral 3.1 24B verbesserte sich die Leistung deutlich, insbesondere bei Programmieraufgaben.
  • Die KI erzeugt eine erste Antwort und bewertet über mehrere „Denk-Runden“ hinweg Alternativen, um die endgültige Antwort auszuwählen.
  • Dieser Prozess umfasst Selbstbewertung, Erzeugung konkurrierender Alternativen, iterative Verbesserung und dynamische Denktiefe.
  • CoRT wird unter der MIT-Lizenz bereitgestellt, und Beiträge zur Verbesserung sind willkommen.

CoRT (Chain of Recursive Thoughts) 🧠🔄

Zusammenfassung

  • Vorgestellt wird CoRT, ein Algorithmus, der KI dazu bringt, mit sich selbst zu debattieren, um bessere Antworten zu finden.
  • Das KI-Modell überprüft seine Antworten wiederholt, erzeugt Alternativen und wählt die optimale Antwort aus.
  • Bei Anwendung auf das Modell Mistral 3.1 24B verbesserte sich die Leistung deutlich, insbesondere bei Programmieraufgaben.

So funktioniert CoRT

  • Die KI erzeugt eine erste Antwort.
  • Die KI entscheidet, wie viele „Denk-Runden“ nötig sind.
  • In jeder Runde:
    • Es werden 3 alternative Antworten erzeugt.
    • Alle Antworten werden bewertet.
    • Die beste Antwort wird ausgewählt.
  • Die endgültige Antwort wird zum Überlebenden dieses KI-Battle-Royale.

Die geheime Zutat

  • Selbstbewertung
  • Erzeugung konkurrierender Alternativen
  • iterative Verbesserung
  • dynamische Denktiefe

Mitwirken

  • Wenn du einen Weg zur Verbesserung gefunden hast, ist ein PR willkommen.

Lizenz

  • Frei nutzbar unter der MIT-Lizenz

1 Kommentare

 
GN⁺ 2025-04-30
Hacker-News-Kommentare
  • Ein KI-Chatmodell soll eine Antwort auf ein Problem geben und anschließend einen Bericht verfassen, der erklärt, warum diese Antwort richtig ist

    • Ein zweites KI-Modell bewertet diesen Bericht und erstellt einen Bericht, der auf Informationen oder logische Widersprüche hinweist, die das ursprüngliche Modell nicht geliefert hat
    • Dieser Prozess wird wiederholt, bis das zweite KI-Modell mit der Erklärung des ersten KI-Modells zufrieden ist oder das erste KI-Modell alle angeforderten Änderungen umgesetzt hat
    • Die Methode ist zwar etwas komplex, liefert aber in den Fällen, in denen sie ausprobiert wurde, ziemlich gute Ergebnisse
  • Ich würde das gern in größerem Maßstab als Always-on-Modus mit Debatten eines "Senats" ausprobieren

    • Statt auf einzelne Probleme zu antworten, würde man eine Aufgabenliste bereitstellen und den Senat sie lösen lassen
    • Ich denke, dass sich durch verschiedene Perspektiven und kritische Analyse beeindruckende Ergebnisse erzielen ließen
    • Es braucht viele Tokens, aber da die Kosten pro Token immer weiter sinken, besteht Potenzial
    • Denkbar wäre auch, einen nur für KI bestimmten IRC-Server einzurichten, damit jeder sein eigenes Modell anschließen und einen gemeinsamen Debattenraum schaffen kann
  • Als einfache Strategie wird eine Nachricht mit der Bitte abgeschlossen: "Bitte denke einmal mit einem Denk-Tag nach, übe dann einmal Selbstkritik mit einem Kritik-Tag und denke schließlich noch einmal mit einem Denk-Tag nach, bevor du antwortest"

    • Das funktioniert gut
    • Es ist auch effektiv, darum zu bitten, die fünf größten Probleme eines Vorschlags zu finden
  • Anders als aufgrund des Titels erwartet

    • Es werden Rollen wie Assistent, Gegenprüfer und Richter festgelegt, und entsprechend diesen Rollen werden Fragen und Antworten durchgeführt
    • Man bittet ChatGPT: "Erkläre es, falls XYZ wahr ist" und "Erkläre es, falls XYZ nicht wahr ist", und sucht dann die überzeugendere Seite
  • Es wird gerade ein Graph-Editor im Stil von Unreal-Engine-Blueprints gebaut, der von einer Benutzereingabe ausgeht und mehrere Agenten Aufgaben ausführen lässt

    • Mistral small 3.1 und gemma 3 fühlen sich wie die ersten lokal ausführbaren halbwegs leistungsfähigen Modelle an
    • Wenn man Python-Ausführung in einer Schleife ausprobiert und das Modell anweist, die Welt zu erkunden, beginnt es, Nachrichten und Ähnliches herunterzuladen und zu lesen
  • Es stellt sich die Frage, ob ein Team aus KI-Agenten ein Scrum-Team betreiben und alle paar Stunden Stand-up-Meetings abhalten würde

    • Ebenso, ob man die Bürokratie einer Regierung nachbilden würde, indem Agenten den ganzen Tag über Themen diskutieren, um zur besten Meinung zu gelangen
  • Eine Methode, ML-Modelle auf neue Ideen zu bringen, besteht darin, sich diagonal an Ideen heranzutasten, die bereits ausprobiert und verworfen wurden, während gewisse Konsistenzbeschränkungen beibehalten werden

  • Wenn nicht alle GPUs schnell auf grüne Energie umgestellt werden, wird die Erde heißer werden, während KI untereinander debattiert, um selbst die optimale Lösung zu finden

  • Es gibt Beispiele mit und ohne CoRT, und das Beispiel ohne CoRT ist deutlich besser

    • Eine merkwürdige Auswahl an Beispielen
  • Dieser Ansatz erinnert an YT-Creator

    • Sie skripten Spiele wie Rennstrecken, damit ein Zielpunkt erreicht wird, und wiederholen das, bis die schnellste Lösung gefunden ist
    • Das nennt man maschinelles Lernen oder Reinforcement Learning
    • Das weitgehend ahnungslose Verständnis von KI ist meist ähnlich