Vorstellung von mathstodon.xyz
- mathstodon.xyz ist Teil eines dezentralen sozialen Netzwerks auf Mastodon-Basis und eine Instanz für Nutzerinnen und Nutzer mit Bezug zur Mathematik.
- Unterstützt LaTeX-Rendering in der Weboberfläche.
- Administrator: Christian Lawson-Perfect (@christianp)
- Server-Statistik: 3K aktive Nutzer
Terence Taos GPT-o1-Experimente
- GPT-o1: Eine neue GPT-Version von OpenAI, die vor der Ausführung des LLM eine anfängliche Reasoning-Phase durchläuft.
- Experiment 1: Identifizierte in einer Antwort auf eine mehrdeutige mathematische Frage korrekt das Cramer's theorem und lieferte eine zufriedenstellende Antwort.
- In früheren Versionen wurden verwandte Konzepte zwar erwähnt, die Details waren jedoch falsch.
- Experiment 2: Bei der Herausforderung durch ein komplexes Problem der Analysis leitete es mit vielen Hinweisen und Zwischenschritten die richtige Lösung her, konnte die zentrale konzeptionelle Idee jedoch nicht selbst erzeugen und machte einige Fehler.
- Gegenüber früheren Modellen verbessert, aber noch immer unzureichend.
- Mit einigen weiteren Verbesserungen könnte es für Arbeit auf Forschungsniveau nützlich werden.
- Experiment 3: Bei der Aufgabe, ein Ergebnis in Lean zu formalisieren, verstand es das Problem gut und zerlegte es anfangs sinnvoll, aber wegen fehlender aktueller Lean-Informationen enthielt der Code mehrere Fehler.
- Könnte in einer integrierten IDE mit auf Lean und Mathlib spezialisierten Modellen sehr nützlich sein.
Weitere Diskussion
- Fortschritt von AI-Tools: Erwartet wird das Entstehen eines Ökosystems von AI-Tools, das verschiedene Forschungsaufgaben bearbeiten kann.
- Derzeit stehen große, allgemeine LLMs im Mittelpunkt, doch auch leichte Open-Source-Modelle für spezifische Anwendungen dürften eine wichtige Rolle spielen.
- Vergleich von AI und Doktoranden: Diskussion darüber, ob AI-Tools Beiträge auf dem Niveau von Doktoranden leisten können.
- Derzeit erfordern sie noch mehr Aufwand als Doktoranden, aber in den kommenden Jahren könnte dieses Verhältnis auf 1 oder weniger sinken.
# Zusammenfassung von GN⁺
- Terence Tao testete das neue Modell GPT-o1 von OpenAI, um seine Fähigkeit zur Lösung mathematischer Probleme zu bewerten.
- GPT-o1 ist gegenüber früheren Versionen verbessert, hat aber weiterhin einige Grenzen.
- Mit einigen weiteren Verbesserungen könnte es für Arbeit auf Forschungsniveau nützlich werden.
- Erwartet wird das Entstehen eines Ökosystems verschiedener AI-Tools zur Unterstützung von Forschungsarbeit.
- Derzeit stehen große, allgemeine LLMs im Mittelpunkt, doch auch leichte Open-Source-Modelle für spezifische Anwendungen dürften eine wichtige Rolle spielen.
1 Kommentare
Hacker-News-Kommentare
Es gibt die Erwartung, dass GPT für Mathematik auf Forschungsniveau nützlicher wird, wenn es in Lean (einem Beweisassistenten) ähnlich wie für Python feinabgestimmt wird
Stell dir vor, du reist ins Jahr 2019 zurück und liest, dass sich die Interaktion mit Alexa "anfühlt wie die Beratung eines durchschnittlichen, aber nicht völlig unfähigen Doktoranden"
Das o1-Modell ist sehr beeindruckend
Die Erfahrungen mit dem O1-Modell fallen sehr unterschiedlich aus
Neu ist, dass sich LLMs bei vielen Themen "anfühlen wie die Beratung eines durchschnittlichen, aber nicht völlig unfähigen Doktoranden"
Auch Menschen können von einer Art "Chain-of-Thought"-Argumentation profitieren
Zustimmung zu Terence Taos Meinung
Man freut sich darauf, Mathematik wieder als eigenständiges Hobby zu studieren
Terence Taos Meinung ist überraschend
Daniel Litt war von o1-preview beeindruckt, hatte aber bisher noch kein Glück damit, interessante mathematische Probleme zu lösen