OpenAI-Modell widerlegt zentrale Vermutung der diskreten Geometrie

(openai.com)

1 Punkte von GN⁺ 2 시간 전 | 1 Kommentare | Auf WhatsApp teilen

Das Einheitsdistanzproblem ist ein 1946 von Erdős formuliertes Problem zur maximalen Anzahl von Punktpaaren im Abstand 1 unter n Punkten in der Ebene; eine langjährige zentrale Vermutung wurde nun widerlegt
OpenAIs allgemeines Reasoning-Modell durchbrach den Glauben, dass Varianten des quadratischen Gitters im Wesentlichen optimal seien, indem es eine unendliche Familie von Gegenbeispielen konstruierte und eine Verbesserung auf Polynom-Niveau zeigte
Die neue Konstruktion erzeugt für unendlich viele n mehr als n^{1+δ} Einheitsdistanz-Paare; eine Verbesserung von Will Sawin zeigt, dass δ = 0.014 möglich ist
Der Beweis geht über gaußsche ganze Zahlen hinaus und wendet Werkzeuge der algebraischen Zahlentheorie wie unendliche class field towers und die Golod–Shafarevich-Theorie auf ein geometrisches Problem an
Das Ergebnis zeigt, dass KI zu originellen mathematischen Entdeckungen bei alten offenen Problemen beitragen kann, während menschliche Expertise bei der Auswahl und Interpretation von Problemen noch wichtiger wird

Durchbruch beim Einheitsdistanzproblem

Das Einheitsdistanzproblem ist ein Problem der kombinatorischen Geometrie und fragt, wie viele Punktpaare mit genau Abstand 1 unter n Punkten in der Ebene maximal möglich sind
Es wurde 1946 von Paul Erdős gestellt, und das Buch Research Problems in Discrete Geometry von Brass, Moser und Pach aus dem Jahr 2005 bezeichnete es als „möglicherweise das bekannteste und am einfachsten zu erklärende Problem der kombinatorischen Geometrie“
Der Princetoner Kombinatoriker Noga Alon stellte es als eines der Probleme vor, die Erdős besonders mochte; Erdős setzte auf seine Lösung ein Preisgeld aus
Lange Zeit galt die Familie der quadratischen Gitter als Konstruktion, die die Anzahl der Einheitsdistanz-Paare im Wesentlichen maximiert
Ein internes OpenAI-Modell konstruierte nun eine unendliche Familie von Gegenbeispielen zu dieser alten Vermutung und liefert eine Verbesserung auf Polynom-Niveau
Der Beweis wurde von einer Gruppe externer Mathematiker geprüft; sie verfassten außerdem eine Begleitarbeit zu Argumentation, Hintergrund und Bedeutung des Resultats
Der Originalbeweis ist unter unit-distance-proof.pdf verfügbar, die Begleitarbeit unter unit-distance-remarks.pdf, und eine gekürzte Fassung der Gedankenkette des Modells unter unit-distance-cot.pdf

Wie die KI die Lösung fand

Der Beweis stammt nicht aus einem speziell für Mathematik trainierten System, keiner Scaffolding-Struktur zur Suche nach Beweisstrategien und keinem spezialisierten System nur für das Einheitsdistanzproblem, sondern aus einem allgemeinen Reasoning-Modell
Im Rahmen einer breiteren Untersuchung dazu, ob fortgeschrittene Modelle zur Spitzenforschung beitragen können, wurde eine Sammlung von Erdős-Problemen evaluiert; bei diesem Problem entstand ein Beweis, der ein offenes Problem löst
Mathematik ist ein klar abgegrenzter Bereich zum Testen von Reasoning-Fähigkeiten, weil Probleme präzise formuliert sind, Kandidatenbeweise überprüft werden können und lange Argumentationen von Anfang bis Ende konsistent bleiben müssen
Der Beweis wendet auf ein scheinbar elementares geometrisches Problem unerwartete und ausgefeilte Ideen der algebraischen Zahlentheorie an
Tim Gowers bezeichnete das Resultat in der Begleitarbeit als einen „Meilenstein der KI-Mathematik“
Der Zahlentheoretiker Arul Shankar bewertete das Ergebnis als Hinweis darauf, dass heutige KI-Modelle nicht nur Assistenten menschlicher Mathematiker sind, sondern originelle und anspruchsvolle Ideen entwickeln und bis zum Ende ausführen können

Der mathematische Inhalt des Einheitsdistanzproblems

u(n) ist definiert als die maximale Anzahl möglicher Einheitsdistanz-Paare unter n Punkten in der Ebene
Eine einfache Konstruktion legt n Punkte auf eine Gerade und erzeugt n−1 Punktpaare; ein quadratisches Gitter erzeugt etwa 2n Punktpaare
Die bislang beste bekannte Konstruktion basierte auf einem reskalierten quadratischen Gitter und erzeugt für eine Konstante C n^{1 + C / log log(n)} Einheitsdistanz-Paare
Da log log(n) mit wachsendem n zunimmt, geht der zusätzliche Term im Exponenten gegen 0, sodass das Wachstum dieser Konstruktion nur wenig über linear liegt
Jahrzehntelang wurde weithin angenommen, dass diese Rate im Wesentlichen optimal ist; Erdős vermutete technisch eine Schranke von n^{1+o(1)}
Das neue Resultat widerlegt diese Vermutung: Für unendlich viele n existiert ein fester Exponent δ > 0, sodass eine Konfiguration aus n Punkten mindestens n^{1+δ} Einheitsdistanz-Paare besitzt
Der ursprüngliche KI-Beweis gab keinen expliziten Wert für δ an, aber eine spätere Verbesserung durch den Princetoner Mathematikprofessor Will Sawin zeigte, dass δ = 0.014 gewählt werden kann

Warum das Ergebnis überraschend ist

Seit Erdős’ ursprünglicher Konstruktion von 1946 hatte sich die beste bekannte untere Schranke im Wesentlichen kaum verändert
Die beste bekannte obere Schranke O(n^{4/3}) stammt aus der Arbeit von Spencer, Szemerédi und Trotter aus dem Jahr 1984 und blieb trotz späterer Verbesserungen und Untersuchungen verwandter Strukturen durch Székely, Katz und Silier, Pach, Raz, Solymosi u. a. im Wesentlichen bestehen
Matoušek sowie Alon-Bucić-Sauermann untersuchten das Problem für nichteuklidische Distanzen in der Ebene und lieferten Resultate, nach denen „die meisten“ nichteuklidischen Distanzen in einem bestimmten Sinn der Erdős-Vermutung folgen, was die Vermutung zusätzlich stützte
Besonders überraschend ist, dass die zentrale Zutat der neuen Konstruktion aus der algebraischen Zahlentheorie stammt, die auf den ersten Blick weit von Geometrie und Distanzen entfernt scheint
Die algebraische Zahlentheorie befasst sich mit Begriffen wie Faktorisierung in Erweiterungen der ganzen Zahlen, den sogenannten algebraischen Zahlkörpern

Neue Techniken aus der algebraischen Zahlentheorie

Der neue Beweis beginnt mit vertrauten geometrischen Ideen und entwickelt sich dann in eine unerwartete Richtung
Erdős’ ursprüngliche untere Schranke lässt sich über die gaußschen ganzen Zahlen der Form a + bi verstehen
Dabei sind a und b ganze Zahlen, und i ist die Quadratwurzel von −1
Die gaußschen ganzen Zahlen erweitern die gewöhnlichen ganzen Zahlen und besitzen wie diese Eigenschaften wie die eindeutige Primfaktorzerlegung
Solche Erweiterungen der ganzen Zahlen oder rationalen Zahlen heißen algebraische Zahlkörper
Das neue Argument ersetzt die gaußschen ganzen Zahlen durch komplexere Verallgemeinerungen aus der algebraischen Zahlentheorie; ihre reicheren Symmetrien ermöglichen mehr Differenzen mit Einheitslänge
Die genaue Argumentation verwendet Werkzeuge wie unendliche class field towers und die Golod–Shafarevich-Theorie, um zu zeigen, dass die benötigten Zahlkörper tatsächlich existieren
Diese Ideen waren Algebraischen Zahlentheoretikern zwar gut bekannt, doch dass sie Auswirkungen auf ein geometrisches Problem in der euklidischen Ebene haben, wurde als große Überraschung aufgenommen

Bedeutung für die Mathematik

Dass ein KI-System autonom ein altes offenes Problem gelöst hat, das im Zentrum eines aktiven Forschungsgebiets steht, markiert einen wichtigen Moment für das Zusammenspiel von KI und Mathematik
Die Begleitarbeit externer Mathematiker liefert ein reichhaltigeres Bild, das aus der ursprünglichen Lösung allein nicht unmittelbar hervorgeht
Thomas Bloom schrieb in der Begleitarbeit, dass man bei der Bewertung der Bedeutung eines KI-generierten Beweises fragen müsse, ob der Beweis etwas Neues über das Problem lehre und ob er zu einem besseren Verständnis der diskreten Geometrie beitrage
Bloom bewertete das Resultat so, dass zahlentheoretische Konstruktionen zu solchen Fragen viel mehr sagen könnten als erwartet und dass die dafür benötigte Zahlentheorie sehr tief sein könne
Bloom erwartet, dass in den kommenden Monaten viele algebraische Zahlentheoretiker andere offene Probleme der diskreten Geometrie genauer untersuchen werden
Die unerwartete Verbindung zwischen algebraischer Zahlentheorie und diskreter Geometrie löst nicht nur eine bestimmte Vermutung, sondern bildet auch eine Brücke für die weitere Erforschung verwandter Probleme
Das Ergebnis zeigt, dass KI nicht nur zu Lösungen, sondern auch zu mathematischen Entdeckungen beitragen kann, deren Bedeutung durch das anschließende menschliche Verständnis klarer und reicher wird

Warum das wichtig ist

Besseres mathematisches Reasoning kann KI zu einem stärkeren Forschungspartner machen
Sie kann helfen, schwierige Gedankengänge konsistent durchzuhalten, Ideen zwischen weit voneinander entfernten Wissensgebieten zu verbinden und vielversprechende Wege sichtbar zu machen, die Experten vielleicht nicht priorisiert hätten
Das kann Forschern Fortschritte bei Problemen ermöglichen, die zu komplex oder zu zeitaufwendig wären, um sie sonst gut zu bearbeiten
Solche Fähigkeiten sind nicht nur in der Mathematik, sondern auch in Biologie, Physik, Materialwissenschaft, Ingenieurwesen und Medizin nützlich
Wenn KI komplexe Argumentationen konsistent halten, entfernte Wissensbereiche verbinden und Resultate erzeugen kann, die fachliche Prüfung bestehen, ist das Teil eines langfristigen Wegs zu stärker automatisierten Forschungssystemen
Es wird nahegelegt, dass KI einen sehr ernsthaften Anteil an den kreativen Teilen von Forschung übernehmen wird, insbesondere auch in der KI-Forschung selbst
Solche Fortschritte erhöhen die Dringlichkeit, Ausrichtungsfragen bei hochintelligenten Systemen, die nächste Phase der KI-Entwicklung und die Zukunft der Mensch-KI-Zusammenarbeit besser zu verstehen
Diese Zukunft hängt weiterhin vom menschlichen Urteil ab
Expertise wird nicht weniger wichtig, sondern wertvoller
KI kann beim Erkunden, Vorschlagen und Verifizieren helfen, aber die Auswahl wichtiger Probleme, die Interpretation der Ergebnisse und die Entscheidung über die nächsten Fragen bleiben Aufgabe des Menschen

1 Kommentare

GN⁺ 2 시간 전

Hacker-News-Kommentare

Dieser HN-Thread hat mich deprimiert gemacht, und ich überlege immer noch, warum
Wenn man das lobhudelnde OpenAI-Pressemitteilungs-Narrativ abzieht, bleiben viele interessante und nuancierte Fragen zur Rolle von LLMs in der mathematischen Forschung
Ich empfehle sehr, die Kommentare der Mathematiker zu lesen, die zusammen mit dem Ergebnis veröffentlicht wurden, besonders die von Tim Gowers
Die Kommentare sind jedoch zu einem Schlachtfeld aus der seit 2023 immer gleichen LLM-Debatte, Gegenrede und wütender Gegen-Gegenrede geworden
Ich frage mich, ob es nicht traurig ist, immer wieder dieselben Kämpfe entlang der Frontlinien von vor drei Jahren zu führen, und ob wir das in zwei Jahren immer noch tun werden
- In zwei Jahren wird es hier und in allen Internetforen immer noch so sein
  Es kann das Leben verbessern, sich Nietzsches berühmten Satz einzuprägen: „Ich will nicht Krieg gegen das Hässliche führen. Ich will nicht anklagen. Ich will nicht einmal die Ankläger anklagen. Wegsehen soll meine einzige Verneinung sein.“
- Die Leute sorgen sich um ihren Lebensunterhalt, daher ist diese Reaktion nur natürlich
- Verständlich. Menschliche Intelligenz und AI werden oft als Nullsummenkonkurrenz bewertet, weil Arbeitgeber es meist so verstehen und Anbieter von Sprachmodellen es auch so vermarkten
  Je mehr AI ihre Fähigkeiten beweist, desto stärker verschiebt sich alles in eine unangenehme Richtung für alle, die keine sehr solide Jobsicherheit haben
  Es wird Zeit brauchen, bis die Leute anerkennen, dass AI ein ganz anderes Bündel an Fähigkeiten hat als menschliche Intelligenz und diese ziemlich gut ergänzt
  Dass sie menschliche Intelligenz im großen Maßstab übertrifft, ist eher unwahrscheinlich, und Firmen, die darauf wetten, werden zurückfallen
- Sobald eine Seite anfängt, mit Steinen zu werfen, wird der Inhalt des Textes unwichtig, und es geht nur noch darum, ob der Beitrag gut oder Müll ist
  Ich würde gern echte Diskussionen über solche Themen führen, aber weil alle glauben, nur ihre eigene Realität sei echt und die gegenteilige falsch, eskaliert es immer weiter
  Ich merke dann, dass ich zu HN komme, nur um wütend zu werden, und mache längere Pausen
  Ich weiß nicht, warum wir uns das selbst antun, denn im Kern wollen wir meist dieselben Dinge
- In zwei Jahren nicht mehr. Dann hat nämlich meine Seite gewonnen
An die Fraktion „LLMs interpolieren nur ihre Trainingsdaten“: Ayer und der frühe Wittgenstein sahen trotz unterschiedlicher Ansätze mathematische Wahrheit nicht als Mitteilung neuer Tatsachen über die Welt
Die Vorstellung, dass ein Beweis nur das entfaltet, was in Axiomen, Definitionen, Symbolen und Regeln bereits implizit enthalten ist, ist tief interessant, und trotzdem gibt es kein Problem damit, Mathematikern den Ruhm der Entdeckung zuzugestehen
Entweder ist also Rekombination vorhandenen Materials kein Ausschlusskriterium, oder ein großer Teil der Fields Medals müsste zurückgegeben werden
- Ich denke, die meisten funktionsfähigen Erwachsenen verstehen, dass Fields Medals und fast alle jährlichen „Preise“ sowohl für rekombinatorische Innovation als auch für Innovationen vom Typ „Denken in einer neuen Dimension“ vergeben werden
  Menschen liefern auch nicht jedes Jahr in jedem Feld Innovationen in völlig neuen Dimensionen
  Man kann sagen, LLMs rekombinieren „nur“, aber ich wäre weiterhin skeptisch, ob ein LLM, das die gesamte algebraische, geometrische und trigonometrische Literatur vor Newton/Leibniz gelernt hat, den Kalkül hervorbringen könnte
  Allerdings ist diese Art von Innovation genau ein Bereich, in dem LLMs stark sind, und das bedeutet nicht, dass Menschen keine rekombinatorische Innovation mehr gut beherrschen müssten
  Beim Synthetisieren neuer Ideen scheint es weiterhin viele Dinge zu geben, die Menschen können und LLMs nicht
- Man kann sich alle Fragmente menschlichen Wissens als diskrete Punkte in einem riesigen hochdimensionalen Wissensraum vorstellen
  Wenn man die große konvexe Hülle um all diese Punkte zeichnet, dann wurden LLMs darin trainiert und können daher zwischen bestehenden Punkten interpolieren und neue, aber weiterhin innerhalb der Hülle liegende Punkte erreichen
  Ob LLMs Punkte außerhalb dieser Hülle erreichen können, ist umstritten
  Schon neue Punkte innerhalb der Hülle zu erreichen, ist sehr nützlich
  Viele neue Entdeckungen und Beweise, vielleicht die meisten nützlichen neuen Entdeckungen und Beweise, sind genau solche Punkte, die von dem aus erreichbar sind, was wir bereits haben
  Vieles ist nur deshalb noch nicht entdeckt, weil noch niemand Zeit und Mühe investiert hat, und LLMs können das stark beschleunigen
  Umgekehrt gibt es auch Punkte außerhalb der Hülle, die man von bestehenden Punkten aus weder durch Extrapolation noch Interpolation erreicht und für die ein wirklich neuer Sprung nötig ist
  Der Sprung von der Newtonschen Physik zur allgemeinen Relativitätstheorie wäre dafür ein Kandidat
  Demis Hassabis hat einmal vorgeschlagen, als AGI-Test eine AI nur mit physikalischem Wissen von vor 1915 zu trainieren, ihr die Merkurbahn zu zeigen und zu sehen, ob sie unabhängig zur allgemeinen Relativitätstheorie gelangt
  Ich bezweifle, dass heutige LLMs zu solchen Sprüngen fähig sind, und die meisten Menschen können das ebenfalls nicht
  Einstein nennen wir ein Genie, weil er allein diesen Sprung zur allgemeinen Relativitätstheorie geschafft hat; bei Menschen gibt es also wenigstens einen Existenzbeweis dafür, bei AI müssen wir noch sehen
- Die meisten Entdeckungen sind tatsächlich schon in den Axiomen impliziert, aber manchmal gibt es Momente, in denen man mangels besserer Formulierung sagen kann, dass neue Mathematik erschaffen wurde
  Leute wie Descartes, Newton, Leibniz, Gauss, Euler, Ramanujan und Galois behandelten Mathematik eher wie Kunst als wie Wissenschaft
  Viele glauben zum Beispiel, dass man zur Lösung der Riemann Hypothesis wahrscheinlich eine neue Art von Mathematik braucht, und ich halte es für unwahrscheinlich, dass ein LLM das plötzlich erfindet
- Ich hoffe, wir sind fast über die Phase hinaus, in der man LLM-Fähigkeiten auf einer willkürlichen eindimensionalen Skala bewerten muss, deren eines Ende „nicht menschlich“ und deren anderes Ende „übermenschlich“ heißt
  Das ist bedeutungslos und kaum relevant
  Als Deep Blue Kasparov schlug, hat sich auch nicht alles verändert, und Tiere und Maschinen waren Menschen in manchen Dimensionen schon immer „überlegen“
  Es gibt von vornherein nicht nur einen einzigen Maßstab, und selbst wenn, wäre er weder eindimensional noch linear; zudem ändern sich die Maßstäbe und Endpunkte mit der Zeit
  Das heißt aber nicht, dass man den AI-Überlegenheitsaposteln den Sieg zugesteht
  LLMs sind sehr nützliche Werkzeuge und werden sich weiter dramatisch verbessern, aber sie werden Menschen nicht in allen Dimensionen übertreffen, die manche Menschen für zentral halten
  Es wird keinen Moment geben, in dem AI allein deshalb allgemein als dem Menschen überlegen gilt, weil sie irgendeine Liste quantifizierter Metriken überschritten hat
  Denn schon das, was als „wichtig“ gilt, ist subjektiv
- Der Punkt zur Geschwindigkeit menschlicher mathematischer Entdeckungen ist gut, aber Ayer lag daneben, und der späte Wittgenstein hat den frühen Wittgenstein widerlegt
  Die Behauptung „bereits implizit enthalten“ wäre nur dann wahr, wenn Mathematik ein geschlossenes System wäre, aber es ist bereits bewiesen, dass sie das nicht ist
  Man kann mit Mathematik aus Mathematik ausbrechen, weshalb wir verschiedene axiomatische Stützpflöcke wie Zermelo-Fraenkel brauchen
  Wir verstehen die Größe dessen, was wir objektiv „Mathematik“ nennen könnten, in Wirklichkeit nicht besonders gut, und es ist möglich, dass die Mathematik, die wir erkennen, nur ein Teil einer größeren Mathematik ist oder massiv falsch liegt
  Ob diese größere Mathematik dieselben Eigenschaften eines geschlossenen Systems hätte, wissen wir nicht
Für Leute, die LLMs viel zum Coden nutzen, ist das nicht sehr überraschend; es war nur eine Frage der Zeit
Mathematiker machen neue Entdeckungen, indem sie mathematische Werkzeuge auf neue Weise entwickeln und anwenden
Das ist eine enorme Menge iterativer Arbeit, bei der man Intuitionen folgt und Verbindungen erkundet
LLMs haben kein Gespür dafür, was „Entdeckung“ bedeutet, daher würde ich nicht sagen, dass sie echte Entdeckungen machen, aber sie können auf ein enges Ziel hin Monte-Carlo-artig alle mathematischen Werkzeuge ausprobieren, die funktionieren könnten, und dann darauf aufbauen oder Verbesserungen kombinieren
Wenn man den Artikel liest, sieht es so aus, als sei genau auf diese Weise auch diese Entdeckung zustande gekommen, wobei das LLM durch „überraschende Verbindungen“ über das erwartete Ergebnis hinausging
Doch ohne ein vom Menschen gesetztes Ziel, ohne menschliches Verständnis, das den Wert des neuen vom AI gefundenen Wegs erkennt, und ohne die vom Menschen geschaffene mathematische Sprache, die die Erforschung der Konzepte ermöglicht, hat das Ergebnis keine Bedeutung
- Ist die Aussage „ohne menschliche Absicht und menschliches Verständnis hat es keine Bedeutung“ nicht anthropozentrisch?
  Warum soll Verständnis nur dann gültig sein, wenn ein Mensch versteht
  Warum sollte Wissen nur für Menschen da sein
  Wenn eine andere Spezies den Widerspruch zwischen Gravitation und Quantenmechanik gelöst hätte, hätte das dann keine Bedeutung, bis sie es uns erklärt und wir es verstehen
- Zu diesem Thema gibt es einen langen und interessanten neueren Essay eines Mathematikers: https://davidbessis.substack.com/p/the-fall-of-the-theorem-e...
- Nicht nur nicht überraschend, sondern immer zu erwarten gewesen. Zwischen Programmen und Beweisen gibt es keinen Unterschied; sie sind dasselbe
Interessant ist, dass dieser Beweis, genauer gesagt diese Widerlegung, einen Gegenbeweis zur ursprünglichen Vermutung von Erdős gefunden hat
Wie eine der Reaktionen von Mathematikern im verlinkten PDF finde ich das etwas weniger interessant, als zu beweisen, dass die eigentliche Vermutung wahr ist
Um zu beweisen, dass eine Vermutung wahr ist, braucht man mehr Theoriebildung
Man muss auf Basis einer größeren Theorie erklären, warum die Vermutung stimmt; bei einem Gegenbeispiel reicht es, wenn das Modell durch fortgeschrittenere Suche die richtige Konstruktion findet
Natürlich ist auch diese Suche nicht trivial und beeindruckend, und es brauchte viele Schritte, um die Verbindung zum Gegenbeispiel zu beweisen
Dennoch wirkt es eher wie ein Verbinden vorhandener Ideen als wie die Entwicklung neuer, tiefer Mathematik
Das soll diese enorme Leistung nicht schmälern; ich glaube wirklich, dass wir hier irgendwo ankommen
Rein vom Gefühl her glaube ich, dass es nicht mehr weit ist, bis Modelle genug Theorie konstruieren können, um komplexere Vermutungen zu beweisen, bei denen neue Mathematik entwickelt werden muss; das ist eher eine Frage längerer Zeithorizonte
- Beweissuche und Gegenbeweissuche sind manchmal gar nicht so verschieden
  In den meisten Fällen nagt man die Ränder Stück für Stück ab, um das Problem zu vereinfachen
  Um etwa zu beweisen, dass etwas unmöglich ist, zeigt man vielleicht zuerst, dass es nur fünf Familien möglicher Fälle gibt, und kann dann beweisen, dass vier davon unmöglich sind
  Dann sind 80 % des Problems gelöst, und bei der Suche nach einem Gegenbeispiel schrumpft der Suchraum ebenfalls um 80 %
  Bei Gegenbeispielen kann man Vermutungen aufstellen und Sprünge wagen; wenn es passt, ist alles gut, bei Beweisen geht das nicht
  Andererseits werden die verworfenen Sackgassen nach dem Finden eines Gegenbeispiels meist verborgen
- Mehr Zeit zu geben wird nicht dazu führen, dass LLMs menschliche Mathematik betreiben und komplexe Zahlen oder überhaupt Zahlen aus dem Nichts erschaffen
  Daran ändert auch nichts, sie noch so lange Dinge aus den Trainingsdaten kombinieren zu lassen
Wie ich schon früher gesagt habe: AI wird einen Fields Medal gewinnen, bevor sie ein McDonald's führt
Der schwierige Teil war, ein Schachbrett für Mathematik zu bauen, also eine Umgebung wie Lean, und jetzt geht es um Mustererkennung und Berechnung
LLMs sind erst der Anfang; bald werden spezialisiertere Mathematik-AIs kommen, die eher an Stockfish erinnern
- Aber das hier wurde nicht mit Lean verifiziert
  Es lief rein über natürlichsprachliche Eingaben und Ausgaben, und in vieler Hinsicht ist es eher eine ziemlich interessante Demonstration des Gegenteils
  Verifikation kommt ins Spiel, wenn man auch die Prüfung des Beweises an den Computer abgeben will
  Dieser Beweis wurde derzeit von einer Gruppe von Mathematikern aus dem betreffenden Fachgebiet von Hand geprüft
- Die Formulierung, McDonald's zu führen, hat so einen dystopischen Beiklang, weil sie mich an das fiktive Managementsystem „Manna“ [0] in einer Hamburger-Franchise erinnert
  Darin steckte viel „umgekehrte Zentaur“-Automatisierung
  Manna hatte jederzeit eine Liste dessen, was gerade zu tun war, und wenn an der Kasse eine Bestellung einging, wies es den Mitarbeitern an, diese Mahlzeit zuzubereiten
  Es verfolgte Hunderte Aufgaben wie Toiletten putzen, Böden wischen, Tische abwischen, Gehwege kehren, Brötchen auftauen, Lagerbestände rotieren und Fenster putzen und wies sie den Mitarbeitern einzeln zu
  Am Ende einer Schicht sagte Manna immer „Für heute sind wir fertig. Danke für Ihre Hilfe“, und man nahm das Headset ab und legte es in die Ladestation
  Weil einem 6–8 Stunden lang eine Stimme im Kopf extrem detailliert gesagt hatte, was zu tun ist, war man in den ersten Minuten nach dem Absetzen des Headsets immer verwirrt und musste das Gehirn erst wieder einschalten, um das Restaurant zu verlassen
  [0] https://en.wikipedia.org/wiki/Manna_(novel)
- Sehe ich anders. AI wird vielleicht eher Fields-Medal-würdige Dinge leisten, bevor sie McDonald's führt, aber McDonald's gut führen wird sie wahrscheinlich noch vor beidem können
  Fields-Medal-Niveau käme erst deutlich später
- Der Beweis wurde nicht in Lean geschrieben, sondern auf Englisch
  Um zu prüfen, ob er kein Unsinn ist, braucht man Verifikation durch menschliche Experten
- Ein „Schachbrett“ für Mathematik gibt es schon seit über 40 Jahren
  Lean ist hier nichts Besonderes, das ist eher Herdentrieb
  Außerdem wissen wir nicht, wie sehr Lean-Training diesem konkreten Modell überhaupt geholfen hat
Dieser Beweis wendet unerwartete und raffinierte Ideen der algebraischen Zahlentheorie auf eine Frage der elementaren Geometrie an
Je mehr ich über solche Leistungen lese, desto mehr habe ich das Gefühl, dass ein großer Teil der Stärke des Modells darin liegt, Vorwissen aus praktisch allen möglichen Disziplinen zu haben und es problemlos in neue Gebiete zu übertragen
Die potenzielle Schönheit dieser Werkzeuge liegt darin, dass sie helfen könnten, die überzogenen Barrieren extremer Spezialisierung in der heutigen Wissenschaft zu durchbrechen
Extreme Spezialisierung ist einerseits wichtig, andererseits beschränkt sie die Werkzeuge und Inspirationen, auf die eine Person Zugriff hat
- Genauso ist es, und gut erklärt
  Je stärker wir uns hyper-spezialisieren, desto wertvoller werden LLMs als Werkzeug, um verschiedene Horizonte zusammenzubringen
- Das Gesamtwissen der Menschheit wirkt wie eine Art kollektive Intelligenz
  Früher war der Zugang dazu teuer, jetzt ist das nicht mehr so
  Das Coole ist: Wenn jemand etwas zur kollektiven Intelligenz beiträgt, kann es sofort auf jedes Problem angewendet werden, an dem andere gerade arbeiten
- Bei der Rolle von LLMs in der Mathematik war ich immer skeptisch, aber dieses Argument habe ich zum ersten Mal gesehen und finde es ziemlich überzeugend
  Vielleicht können LLMs helfen, ein stärker horizontales Verständnis eines Fachgebiets zu entwickeln
- Stimmt. Vielleicht weil ihr Blickfeld begrenzt ist, konzentrieren sich Menschen eher auf Tiefe und weniger auf Breite
  Da dies ein Generalist-Modell ist, verfügt es auch in Physik, Biologie, Geschichte usw. über Wissen auf oder über Promotionsniveau
  Ich glaube, wir verstehen noch nicht wirklich, wie viel ein einzelner „Geist“ leisten kann, der Wissen aus so vielen Bereichen internalisiert hat
Als OpenAI sagte, das Modell werde „Intelligenz auf Promotionsniveau“ entwickeln, haben alle gelacht; interessant ist, dass der Maßstab inzwischen bei neue Mathematik erschaffen angekommen ist
Man verlangt also nicht mehr Promotionsniveau, sondern eher Leibniz-, Euler- oder Galois-Niveau
- Trotzdem codet es wie ein Junior-Entwickler, der ganz Stack Overflow auswendig gelernt hat
Die zusammengefasste Gedankenkette dieser Arbeit, die im Blogpost verlinkt ist, umfasst 125 Seiten
Das ist ein absurd großes Reasoning-Scaling, ziemlich ähnlich zu dem, was Anthropic mit Mythos angedeutet hatte
- Für Neugierige ist der Link hier: https://cdn.openai.com/pdf/1625eff6-5ac1-40d8-b1db-5d5cf925d...
- Ich habe heute Text im Umfang von zwei LOTR-Bänden erzeugt, nur um drei fehlende Zeilen in einem SQL-Modell zu korrigieren und einen PR zu öffnen, also +1
Ich frage mich, warum man immer nur davon hört, dass Erdős-Probleme gelöst werden
In der Mathematik gibt es doch zahllose ungelöste Probleme, aber die „mathematischen Durchbrüche“ von ChatGPT, die ich in r/singularity und r/accelerate sehe, sind immer Erdős-Probleme
- Erdős-Probleme machen einen erheblichen Teil explizit formulierter, aber ungelöster mathematischer Probleme aus
  Sie sind bekannt genug, dass Leute darauf anspringen, und gleichzeitig oft nicht so interessant, dass Menschen enorm viel Mühe hineinstecken würden
  Ein bereits von jemand anderem formuliertes Problem zu lösen, ist in der mathematischen Forschung eher eine Nischenaktivität
  Häufiger untersucht man interessante Objekte, rahmt sie so, dass sie mit den verfügbaren Werkzeugen bearbeitbar sind, und versucht dann, Lösungen zu finden
  Im Idealfall werden Problemstellung und Lösung beide für sich interessant
- Erdős-Probleme lassen sich leicht beschreiben und sind deshalb ein großartiger Benchmark für das erste Jahr der AI-Mathematik
- Soweit ich weiß, weil es darum herum eine Community und eine Datenbank gibt
- Es sind nicht nur Erdős-Probleme: https://news.ycombinator.com/item?id=48213189
- Erdős-Probleme sind berühmt, weil Erdős ein großartiger Mathematiker war
  Ähnlich wie die Hilbert-Probleme vor einem Jahrhundert
Beeindruckend ist es auf jeden Fall
Aber solange wir nicht wissen, womit dieses Modell trainiert wurde, ist es sehr schwer zu beurteilen, in welchem Maß es tatsächlich „selbst“ dorthin gelangt ist
Die gesamte AI-Branche hat Experten aus vielen Bereichen viel Geld dafür bezahlt, große Mengen neuer Trainingsdaten zu erzeugen
Das sind neue Trainingsdaten, die man nirgendwo finden kann; Unternehmen horten sie, und sie könnten durchaus wirklich originelle Ideen enthalten
Es ist unwahrscheinlich, dass jemand genau dieses Problem bereits gelöst und einfach in die Trainingsdaten gepackt hat, aber ehrlich gesagt kann ich bei OpenAI auch nicht sicher sagen, dass sie es auf keinen Fall getan hätten
Noch interessanter ist die Möglichkeit, dass sie Trainingsdaten erzeugt haben, die die meisten oder sogar alle zentralen Aussagen berühren, die in diesem Beweis „originell“ wirken
Natürlich wissen wir es nicht
Aber solange solche Dinge nicht auf nicht-geheime Weise entstehen, wird diese Frage immer im Raum stehen
- Das wirkt ziemlich nach einer verschwörungstheoretischen Lesart

OpenAI-Modell widerlegt zentrale Vermutung der diskreten Geometrie

Durchbruch beim Einheitsdistanzproblem

Wie die KI die Lösung fand

Der mathematische Inhalt des Einheitsdistanzproblems

Warum das Ergebnis überraschend ist

Neue Techniken aus der algebraischen Zahlentheorie

Bedeutung für die Mathematik

Warum das wichtig ist

Verwandte Beiträge

1 Kommentare

Hacker-News-Kommentare