Die Grenzen von Leela Chess Zero
- Leela Chess Zero wurde durch Selbstspiel über Milliarden von Trainingsdurchläufen zum Weltmeister
- Verlor jedoch deutlich gegen Stockfish
- Auch das Training eines größeren Netzwerks konnte Stockfish nicht schlagen
- Stockfish nutzte ein viel kleineres Modell als Leela, gewann jedoch dank besserer Suchfähigkeiten
Weitere Gedanken zu Stockfishs Sieg
- Leela verlor den Weltmeistertitel, weil es nicht gut suchen konnte
- Die Ergänzung von LLMs um Suchfähigkeiten rückt näher, bekommt aber wenig Aufmerksamkeit
- Foundation-Modelle wie GPT-4 besitzen keine Suchfähigkeiten
- Es dominiert die Annahme, dass größere Modelle nötig seien, um Suche zu ermöglichen, doch es gibt Gegenbeispiele
- Laut Forschung von DeepMind entsteht Suchverhalten in Schachalgorithmen auf natürliche Weise
- Wenn es effiziente Suchalgorithmen gibt, muss man nicht darauf warten, dass ineffiziente Vorläufer-Suche zufällig in großen Modellen entsteht
- Die heutigen Modelle sind groß genug, um Suche zu ermöglichen, und möglicherweise sogar unnötig groß
Suche ermöglicht die Zuweisung von Rechenressourcen für den Zielbereich
- Angenommen, ein Pharmaunternehmen möchte mit AI neue Medikamente erforschen
- In einer Welt mit AI-Suche gibt es zwei Optionen
- Bis 2030 warten und hoffen, dass OpenAI ein Modell veröffentlicht, das um vier Größenordnungen größer ist, oder
- Schon heute um vier Größenordnungen mehr Inference-Compute einsetzen
- Das Pharmaunternehmen würde die zweite Option bevorzugen
- Durch Suche ließen sich Fähigkeiten auf ASI-Niveau von 2030 sofort nutzen
Szenario einer suchbasierten AI-Entwicklung
- Es wird entdeckt, dass Suche in bestehenden Modellen funktioniert
- Regierungen oder große Forschungseinrichtungen erkennen, dass sie Suche sofort auf AI-Forschung oder die Sammlung ausländischer Informationen anwenden können
- Da Inference-Compute begrenzt ist, bleibt dies auf Regierungen oder große Forschungseinrichtungen und auf Sicherheit oder AI-Forschung beschränkt
- Eine suchgetriebene AI-Entwicklung führt zur Entdeckung effizienterer Suchalgorithmen und Modellarchitekturen
- Suche erfordert keine zusätzlichen Trainingsdaten und löst damit das Problem der „Datenmauer“
- Die Intelligenzexplosion beginnt nicht 2030, sondern schon im nächsten Jahr
Möglichkeit, Suche auf AI-Forschung selbst anzuwenden
- Wenn AI weit genug entwickelt ist, um sich selbst zu erforschen, ist mit einer abrupten Entwicklungsdynamik zu rechnen
- So wie Pharmaunternehmen nicht auf GPT-8 warten müssen, um neue Medikamente zu erforschen, können auch AI-Labore AI erforschen, ohne auf größere Modelle zu warten
- Um menschliche AI-Forschende zu ersetzen, könnten weitere Beschränkungen aufgehoben werden müssen
- Doch selbst ein einfacher Chatbot mit Intelligenz auf GPT-8-Niveau dürfte ausreichen, um die AI-Entwicklung zu beschleunigen
1 Kommentare
Hacker-News-Diskussion
Zusammenfassung der Hacker-News-Kommentare