1 Punkte von GN⁺ 2 시간 전 | 1 Kommentare | Auf WhatsApp teilen
  • Das Einheitsdistanzproblem ist ein 1946 von Erdős formuliertes Problem zur maximalen Anzahl von Punktpaaren im Abstand 1 unter n Punkten in der Ebene; eine langjährige zentrale Vermutung wurde nun widerlegt
  • OpenAIs allgemeines Reasoning-Modell durchbrach den Glauben, dass Varianten des quadratischen Gitters im Wesentlichen optimal seien, indem es eine unendliche Familie von Gegenbeispielen konstruierte und eine Verbesserung auf Polynom-Niveau zeigte
  • Die neue Konstruktion erzeugt für unendlich viele n mehr als n^{1+δ} Einheitsdistanz-Paare; eine Verbesserung von Will Sawin zeigt, dass δ = 0.014 möglich ist
  • Der Beweis geht über gaußsche ganze Zahlen hinaus und wendet Werkzeuge der algebraischen Zahlentheorie wie unendliche class field towers und die Golod–Shafarevich-Theorie auf ein geometrisches Problem an
  • Das Ergebnis zeigt, dass KI zu originellen mathematischen Entdeckungen bei alten offenen Problemen beitragen kann, während menschliche Expertise bei der Auswahl und Interpretation von Problemen noch wichtiger wird

Durchbruch beim Einheitsdistanzproblem

  • Das Einheitsdistanzproblem ist ein Problem der kombinatorischen Geometrie und fragt, wie viele Punktpaare mit genau Abstand 1 unter n Punkten in der Ebene maximal möglich sind
  • Es wurde 1946 von Paul Erdős gestellt, und das Buch Research Problems in Discrete Geometry von Brass, Moser und Pach aus dem Jahr 2005 bezeichnete es als „möglicherweise das bekannteste und am einfachsten zu erklärende Problem der kombinatorischen Geometrie“
  • Der Princetoner Kombinatoriker Noga Alon stellte es als eines der Probleme vor, die Erdős besonders mochte; Erdős setzte auf seine Lösung ein Preisgeld aus
  • Lange Zeit galt die Familie der quadratischen Gitter als Konstruktion, die die Anzahl der Einheitsdistanz-Paare im Wesentlichen maximiert
  • Ein internes OpenAI-Modell konstruierte nun eine unendliche Familie von Gegenbeispielen zu dieser alten Vermutung und liefert eine Verbesserung auf Polynom-Niveau
  • Der Beweis wurde von einer Gruppe externer Mathematiker geprüft; sie verfassten außerdem eine Begleitarbeit zu Argumentation, Hintergrund und Bedeutung des Resultats
  • Der Originalbeweis ist unter unit-distance-proof.pdf verfügbar, die Begleitarbeit unter unit-distance-remarks.pdf, und eine gekürzte Fassung der Gedankenkette des Modells unter unit-distance-cot.pdf

Wie die KI die Lösung fand

  • Der Beweis stammt nicht aus einem speziell für Mathematik trainierten System, keiner Scaffolding-Struktur zur Suche nach Beweisstrategien und keinem spezialisierten System nur für das Einheitsdistanzproblem, sondern aus einem allgemeinen Reasoning-Modell
  • Im Rahmen einer breiteren Untersuchung dazu, ob fortgeschrittene Modelle zur Spitzenforschung beitragen können, wurde eine Sammlung von Erdős-Problemen evaluiert; bei diesem Problem entstand ein Beweis, der ein offenes Problem löst
  • Mathematik ist ein klar abgegrenzter Bereich zum Testen von Reasoning-Fähigkeiten, weil Probleme präzise formuliert sind, Kandidatenbeweise überprüft werden können und lange Argumentationen von Anfang bis Ende konsistent bleiben müssen
  • Der Beweis wendet auf ein scheinbar elementares geometrisches Problem unerwartete und ausgefeilte Ideen der algebraischen Zahlentheorie an
  • Tim Gowers bezeichnete das Resultat in der Begleitarbeit als einen „Meilenstein der KI-Mathematik“
  • Der Zahlentheoretiker Arul Shankar bewertete das Ergebnis als Hinweis darauf, dass heutige KI-Modelle nicht nur Assistenten menschlicher Mathematiker sind, sondern originelle und anspruchsvolle Ideen entwickeln und bis zum Ende ausführen können

Der mathematische Inhalt des Einheitsdistanzproblems

  • u(n) ist definiert als die maximale Anzahl möglicher Einheitsdistanz-Paare unter n Punkten in der Ebene
  • Eine einfache Konstruktion legt n Punkte auf eine Gerade und erzeugt n−1 Punktpaare; ein quadratisches Gitter erzeugt etwa 2n Punktpaare
  • Die bislang beste bekannte Konstruktion basierte auf einem reskalierten quadratischen Gitter und erzeugt für eine Konstante C n^{1 + C / log log(n)} Einheitsdistanz-Paare
  • Da log log(n) mit wachsendem n zunimmt, geht der zusätzliche Term im Exponenten gegen 0, sodass das Wachstum dieser Konstruktion nur wenig über linear liegt
  • Jahrzehntelang wurde weithin angenommen, dass diese Rate im Wesentlichen optimal ist; Erdős vermutete technisch eine Schranke von n^{1+o(1)}
  • Das neue Resultat widerlegt diese Vermutung: Für unendlich viele n existiert ein fester Exponent δ > 0, sodass eine Konfiguration aus n Punkten mindestens n^{1+δ} Einheitsdistanz-Paare besitzt
  • Der ursprüngliche KI-Beweis gab keinen expliziten Wert für δ an, aber eine spätere Verbesserung durch den Princetoner Mathematikprofessor Will Sawin zeigte, dass δ = 0.014 gewählt werden kann

Warum das Ergebnis überraschend ist

  • Seit Erdős’ ursprünglicher Konstruktion von 1946 hatte sich die beste bekannte untere Schranke im Wesentlichen kaum verändert
  • Die beste bekannte obere Schranke O(n^{4/3}) stammt aus der Arbeit von Spencer, Szemerédi und Trotter aus dem Jahr 1984 und blieb trotz späterer Verbesserungen und Untersuchungen verwandter Strukturen durch Székely, Katz und Silier, Pach, Raz, Solymosi u. a. im Wesentlichen bestehen
  • Matoušek sowie Alon-Bucić-Sauermann untersuchten das Problem für nichteuklidische Distanzen in der Ebene und lieferten Resultate, nach denen „die meisten“ nichteuklidischen Distanzen in einem bestimmten Sinn der Erdős-Vermutung folgen, was die Vermutung zusätzlich stützte
  • Besonders überraschend ist, dass die zentrale Zutat der neuen Konstruktion aus der algebraischen Zahlentheorie stammt, die auf den ersten Blick weit von Geometrie und Distanzen entfernt scheint
  • Die algebraische Zahlentheorie befasst sich mit Begriffen wie Faktorisierung in Erweiterungen der ganzen Zahlen, den sogenannten algebraischen Zahlkörpern

Neue Techniken aus der algebraischen Zahlentheorie

  • Der neue Beweis beginnt mit vertrauten geometrischen Ideen und entwickelt sich dann in eine unerwartete Richtung
  • Erdős’ ursprüngliche untere Schranke lässt sich über die gaußschen ganzen Zahlen der Form a + bi verstehen
  • Dabei sind a und b ganze Zahlen, und i ist die Quadratwurzel von −1
  • Die gaußschen ganzen Zahlen erweitern die gewöhnlichen ganzen Zahlen und besitzen wie diese Eigenschaften wie die eindeutige Primfaktorzerlegung
  • Solche Erweiterungen der ganzen Zahlen oder rationalen Zahlen heißen algebraische Zahlkörper
  • Das neue Argument ersetzt die gaußschen ganzen Zahlen durch komplexere Verallgemeinerungen aus der algebraischen Zahlentheorie; ihre reicheren Symmetrien ermöglichen mehr Differenzen mit Einheitslänge
  • Die genaue Argumentation verwendet Werkzeuge wie unendliche class field towers und die Golod–Shafarevich-Theorie, um zu zeigen, dass die benötigten Zahlkörper tatsächlich existieren
  • Diese Ideen waren Algebraischen Zahlentheoretikern zwar gut bekannt, doch dass sie Auswirkungen auf ein geometrisches Problem in der euklidischen Ebene haben, wurde als große Überraschung aufgenommen

Bedeutung für die Mathematik

  • Dass ein KI-System autonom ein altes offenes Problem gelöst hat, das im Zentrum eines aktiven Forschungsgebiets steht, markiert einen wichtigen Moment für das Zusammenspiel von KI und Mathematik
  • Die Begleitarbeit externer Mathematiker liefert ein reichhaltigeres Bild, das aus der ursprünglichen Lösung allein nicht unmittelbar hervorgeht
  • Thomas Bloom schrieb in der Begleitarbeit, dass man bei der Bewertung der Bedeutung eines KI-generierten Beweises fragen müsse, ob der Beweis etwas Neues über das Problem lehre und ob er zu einem besseren Verständnis der diskreten Geometrie beitrage
  • Bloom bewertete das Resultat so, dass zahlentheoretische Konstruktionen zu solchen Fragen viel mehr sagen könnten als erwartet und dass die dafür benötigte Zahlentheorie sehr tief sein könne
  • Bloom erwartet, dass in den kommenden Monaten viele algebraische Zahlentheoretiker andere offene Probleme der diskreten Geometrie genauer untersuchen werden
  • Die unerwartete Verbindung zwischen algebraischer Zahlentheorie und diskreter Geometrie löst nicht nur eine bestimmte Vermutung, sondern bildet auch eine Brücke für die weitere Erforschung verwandter Probleme
  • Das Ergebnis zeigt, dass KI nicht nur zu Lösungen, sondern auch zu mathematischen Entdeckungen beitragen kann, deren Bedeutung durch das anschließende menschliche Verständnis klarer und reicher wird

Warum das wichtig ist

  • Besseres mathematisches Reasoning kann KI zu einem stärkeren Forschungspartner machen
  • Sie kann helfen, schwierige Gedankengänge konsistent durchzuhalten, Ideen zwischen weit voneinander entfernten Wissensgebieten zu verbinden und vielversprechende Wege sichtbar zu machen, die Experten vielleicht nicht priorisiert hätten
  • Das kann Forschern Fortschritte bei Problemen ermöglichen, die zu komplex oder zu zeitaufwendig wären, um sie sonst gut zu bearbeiten
  • Solche Fähigkeiten sind nicht nur in der Mathematik, sondern auch in Biologie, Physik, Materialwissenschaft, Ingenieurwesen und Medizin nützlich
  • Wenn KI komplexe Argumentationen konsistent halten, entfernte Wissensbereiche verbinden und Resultate erzeugen kann, die fachliche Prüfung bestehen, ist das Teil eines langfristigen Wegs zu stärker automatisierten Forschungssystemen
  • Es wird nahegelegt, dass KI einen sehr ernsthaften Anteil an den kreativen Teilen von Forschung übernehmen wird, insbesondere auch in der KI-Forschung selbst
  • Solche Fortschritte erhöhen die Dringlichkeit, Ausrichtungsfragen bei hochintelligenten Systemen, die nächste Phase der KI-Entwicklung und die Zukunft der Mensch-KI-Zusammenarbeit besser zu verstehen
  • Diese Zukunft hängt weiterhin vom menschlichen Urteil ab
  • Expertise wird nicht weniger wichtig, sondern wertvoller
  • KI kann beim Erkunden, Vorschlagen und Verifizieren helfen, aber die Auswahl wichtiger Probleme, die Interpretation der Ergebnisse und die Entscheidung über die nächsten Fragen bleiben Aufgabe des Menschen

1 Kommentare

 
GN⁺ 2 시간 전
Hacker-News-Kommentare
  • Dieser HN-Thread hat mich deprimiert gemacht, und ich überlege immer noch, warum
    Wenn man das lobhudelnde OpenAI-Pressemitteilungs-Narrativ abzieht, bleiben viele interessante und nuancierte Fragen zur Rolle von LLMs in der mathematischen Forschung
    Ich empfehle sehr, die Kommentare der Mathematiker zu lesen, die zusammen mit dem Ergebnis veröffentlicht wurden, besonders die von Tim Gowers
    Die Kommentare sind jedoch zu einem Schlachtfeld aus der seit 2023 immer gleichen LLM-Debatte, Gegenrede und wütender Gegen-Gegenrede geworden
    Ich frage mich, ob es nicht traurig ist, immer wieder dieselben Kämpfe entlang der Frontlinien von vor drei Jahren zu führen, und ob wir das in zwei Jahren immer noch tun werden

    • In zwei Jahren wird es hier und in allen Internetforen immer noch so sein
      Es kann das Leben verbessern, sich Nietzsches berühmten Satz einzuprägen: „Ich will nicht Krieg gegen das Hässliche führen. Ich will nicht anklagen. Ich will nicht einmal die Ankläger anklagen. Wegsehen soll meine einzige Verneinung sein.“
    • Die Leute sorgen sich um ihren Lebensunterhalt, daher ist diese Reaktion nur natürlich
    • Verständlich. Menschliche Intelligenz und AI werden oft als Nullsummenkonkurrenz bewertet, weil Arbeitgeber es meist so verstehen und Anbieter von Sprachmodellen es auch so vermarkten
      Je mehr AI ihre Fähigkeiten beweist, desto stärker verschiebt sich alles in eine unangenehme Richtung für alle, die keine sehr solide Jobsicherheit haben
      Es wird Zeit brauchen, bis die Leute anerkennen, dass AI ein ganz anderes Bündel an Fähigkeiten hat als menschliche Intelligenz und diese ziemlich gut ergänzt
      Dass sie menschliche Intelligenz im großen Maßstab übertrifft, ist eher unwahrscheinlich, und Firmen, die darauf wetten, werden zurückfallen
    • Sobald eine Seite anfängt, mit Steinen zu werfen, wird der Inhalt des Textes unwichtig, und es geht nur noch darum, ob der Beitrag gut oder Müll ist
      Ich würde gern echte Diskussionen über solche Themen führen, aber weil alle glauben, nur ihre eigene Realität sei echt und die gegenteilige falsch, eskaliert es immer weiter
      Ich merke dann, dass ich zu HN komme, nur um wütend zu werden, und mache längere Pausen
      Ich weiß nicht, warum wir uns das selbst antun, denn im Kern wollen wir meist dieselben Dinge
    • In zwei Jahren nicht mehr. Dann hat nämlich meine Seite gewonnen
  • An die Fraktion „LLMs interpolieren nur ihre Trainingsdaten“: Ayer und der frühe Wittgenstein sahen trotz unterschiedlicher Ansätze mathematische Wahrheit nicht als Mitteilung neuer Tatsachen über die Welt
    Die Vorstellung, dass ein Beweis nur das entfaltet, was in Axiomen, Definitionen, Symbolen und Regeln bereits implizit enthalten ist, ist tief interessant, und trotzdem gibt es kein Problem damit, Mathematikern den Ruhm der Entdeckung zuzugestehen
    Entweder ist also Rekombination vorhandenen Materials kein Ausschlusskriterium, oder ein großer Teil der Fields Medals müsste zurückgegeben werden

    • Ich denke, die meisten funktionsfähigen Erwachsenen verstehen, dass Fields Medals und fast alle jährlichen „Preise“ sowohl für rekombinatorische Innovation als auch für Innovationen vom Typ „Denken in einer neuen Dimension“ vergeben werden
      Menschen liefern auch nicht jedes Jahr in jedem Feld Innovationen in völlig neuen Dimensionen
      Man kann sagen, LLMs rekombinieren „nur“, aber ich wäre weiterhin skeptisch, ob ein LLM, das die gesamte algebraische, geometrische und trigonometrische Literatur vor Newton/Leibniz gelernt hat, den Kalkül hervorbringen könnte
      Allerdings ist diese Art von Innovation genau ein Bereich, in dem LLMs stark sind, und das bedeutet nicht, dass Menschen keine rekombinatorische Innovation mehr gut beherrschen müssten
      Beim Synthetisieren neuer Ideen scheint es weiterhin viele Dinge zu geben, die Menschen können und LLMs nicht
    • Man kann sich alle Fragmente menschlichen Wissens als diskrete Punkte in einem riesigen hochdimensionalen Wissensraum vorstellen
      Wenn man die große konvexe Hülle um all diese Punkte zeichnet, dann wurden LLMs darin trainiert und können daher zwischen bestehenden Punkten interpolieren und neue, aber weiterhin innerhalb der Hülle liegende Punkte erreichen
      Ob LLMs Punkte außerhalb dieser Hülle erreichen können, ist umstritten
      Schon neue Punkte innerhalb der Hülle zu erreichen, ist sehr nützlich
      Viele neue Entdeckungen und Beweise, vielleicht die meisten nützlichen neuen Entdeckungen und Beweise, sind genau solche Punkte, die von dem aus erreichbar sind, was wir bereits haben
      Vieles ist nur deshalb noch nicht entdeckt, weil noch niemand Zeit und Mühe investiert hat, und LLMs können das stark beschleunigen
      Umgekehrt gibt es auch Punkte außerhalb der Hülle, die man von bestehenden Punkten aus weder durch Extrapolation noch Interpolation erreicht und für die ein wirklich neuer Sprung nötig ist
      Der Sprung von der Newtonschen Physik zur allgemeinen Relativitätstheorie wäre dafür ein Kandidat
      Demis Hassabis hat einmal vorgeschlagen, als AGI-Test eine AI nur mit physikalischem Wissen von vor 1915 zu trainieren, ihr die Merkurbahn zu zeigen und zu sehen, ob sie unabhängig zur allgemeinen Relativitätstheorie gelangt
      Ich bezweifle, dass heutige LLMs zu solchen Sprüngen fähig sind, und die meisten Menschen können das ebenfalls nicht
      Einstein nennen wir ein Genie, weil er allein diesen Sprung zur allgemeinen Relativitätstheorie geschafft hat; bei Menschen gibt es also wenigstens einen Existenzbeweis dafür, bei AI müssen wir noch sehen
    • Die meisten Entdeckungen sind tatsächlich schon in den Axiomen impliziert, aber manchmal gibt es Momente, in denen man mangels besserer Formulierung sagen kann, dass neue Mathematik erschaffen wurde
      Leute wie Descartes, Newton, Leibniz, Gauss, Euler, Ramanujan und Galois behandelten Mathematik eher wie Kunst als wie Wissenschaft
      Viele glauben zum Beispiel, dass man zur Lösung der Riemann Hypothesis wahrscheinlich eine neue Art von Mathematik braucht, und ich halte es für unwahrscheinlich, dass ein LLM das plötzlich erfindet
    • Ich hoffe, wir sind fast über die Phase hinaus, in der man LLM-Fähigkeiten auf einer willkürlichen eindimensionalen Skala bewerten muss, deren eines Ende „nicht menschlich“ und deren anderes Ende „übermenschlich“ heißt
      Das ist bedeutungslos und kaum relevant
      Als Deep Blue Kasparov schlug, hat sich auch nicht alles verändert, und Tiere und Maschinen waren Menschen in manchen Dimensionen schon immer „überlegen“
      Es gibt von vornherein nicht nur einen einzigen Maßstab, und selbst wenn, wäre er weder eindimensional noch linear; zudem ändern sich die Maßstäbe und Endpunkte mit der Zeit
      Das heißt aber nicht, dass man den AI-Überlegenheitsaposteln den Sieg zugesteht
      LLMs sind sehr nützliche Werkzeuge und werden sich weiter dramatisch verbessern, aber sie werden Menschen nicht in allen Dimensionen übertreffen, die manche Menschen für zentral halten
      Es wird keinen Moment geben, in dem AI allein deshalb allgemein als dem Menschen überlegen gilt, weil sie irgendeine Liste quantifizierter Metriken überschritten hat
      Denn schon das, was als „wichtig“ gilt, ist subjektiv
    • Der Punkt zur Geschwindigkeit menschlicher mathematischer Entdeckungen ist gut, aber Ayer lag daneben, und der späte Wittgenstein hat den frühen Wittgenstein widerlegt
      Die Behauptung „bereits implizit enthalten“ wäre nur dann wahr, wenn Mathematik ein geschlossenes System wäre, aber es ist bereits bewiesen, dass sie das nicht ist
      Man kann mit Mathematik aus Mathematik ausbrechen, weshalb wir verschiedene axiomatische Stützpflöcke wie Zermelo-Fraenkel brauchen
      Wir verstehen die Größe dessen, was wir objektiv „Mathematik“ nennen könnten, in Wirklichkeit nicht besonders gut, und es ist möglich, dass die Mathematik, die wir erkennen, nur ein Teil einer größeren Mathematik ist oder massiv falsch liegt
      Ob diese größere Mathematik dieselben Eigenschaften eines geschlossenen Systems hätte, wissen wir nicht
  • Für Leute, die LLMs viel zum Coden nutzen, ist das nicht sehr überraschend; es war nur eine Frage der Zeit
    Mathematiker machen neue Entdeckungen, indem sie mathematische Werkzeuge auf neue Weise entwickeln und anwenden
    Das ist eine enorme Menge iterativer Arbeit, bei der man Intuitionen folgt und Verbindungen erkundet
    LLMs haben kein Gespür dafür, was „Entdeckung“ bedeutet, daher würde ich nicht sagen, dass sie echte Entdeckungen machen, aber sie können auf ein enges Ziel hin Monte-Carlo-artig alle mathematischen Werkzeuge ausprobieren, die funktionieren könnten, und dann darauf aufbauen oder Verbesserungen kombinieren
    Wenn man den Artikel liest, sieht es so aus, als sei genau auf diese Weise auch diese Entdeckung zustande gekommen, wobei das LLM durch „überraschende Verbindungen“ über das erwartete Ergebnis hinausging
    Doch ohne ein vom Menschen gesetztes Ziel, ohne menschliches Verständnis, das den Wert des neuen vom AI gefundenen Wegs erkennt, und ohne die vom Menschen geschaffene mathematische Sprache, die die Erforschung der Konzepte ermöglicht, hat das Ergebnis keine Bedeutung

    • Ist die Aussage „ohne menschliche Absicht und menschliches Verständnis hat es keine Bedeutung“ nicht anthropozentrisch?
      Warum soll Verständnis nur dann gültig sein, wenn ein Mensch versteht
      Warum sollte Wissen nur für Menschen da sein
      Wenn eine andere Spezies den Widerspruch zwischen Gravitation und Quantenmechanik gelöst hätte, hätte das dann keine Bedeutung, bis sie es uns erklärt und wir es verstehen
    • Zu diesem Thema gibt es einen langen und interessanten neueren Essay eines Mathematikers: https://davidbessis.substack.com/p/the-fall-of-the-theorem-e...
    • Nicht nur nicht überraschend, sondern immer zu erwarten gewesen. Zwischen Programmen und Beweisen gibt es keinen Unterschied; sie sind dasselbe
  • Interessant ist, dass dieser Beweis, genauer gesagt diese Widerlegung, einen Gegenbeweis zur ursprünglichen Vermutung von Erdős gefunden hat
    Wie eine der Reaktionen von Mathematikern im verlinkten PDF finde ich das etwas weniger interessant, als zu beweisen, dass die eigentliche Vermutung wahr ist
    Um zu beweisen, dass eine Vermutung wahr ist, braucht man mehr Theoriebildung
    Man muss auf Basis einer größeren Theorie erklären, warum die Vermutung stimmt; bei einem Gegenbeispiel reicht es, wenn das Modell durch fortgeschrittenere Suche die richtige Konstruktion findet
    Natürlich ist auch diese Suche nicht trivial und beeindruckend, und es brauchte viele Schritte, um die Verbindung zum Gegenbeispiel zu beweisen
    Dennoch wirkt es eher wie ein Verbinden vorhandener Ideen als wie die Entwicklung neuer, tiefer Mathematik
    Das soll diese enorme Leistung nicht schmälern; ich glaube wirklich, dass wir hier irgendwo ankommen
    Rein vom Gefühl her glaube ich, dass es nicht mehr weit ist, bis Modelle genug Theorie konstruieren können, um komplexere Vermutungen zu beweisen, bei denen neue Mathematik entwickelt werden muss; das ist eher eine Frage längerer Zeithorizonte

    • Beweissuche und Gegenbeweissuche sind manchmal gar nicht so verschieden
      In den meisten Fällen nagt man die Ränder Stück für Stück ab, um das Problem zu vereinfachen
      Um etwa zu beweisen, dass etwas unmöglich ist, zeigt man vielleicht zuerst, dass es nur fünf Familien möglicher Fälle gibt, und kann dann beweisen, dass vier davon unmöglich sind
      Dann sind 80 % des Problems gelöst, und bei der Suche nach einem Gegenbeispiel schrumpft der Suchraum ebenfalls um 80 %
      Bei Gegenbeispielen kann man Vermutungen aufstellen und Sprünge wagen; wenn es passt, ist alles gut, bei Beweisen geht das nicht
      Andererseits werden die verworfenen Sackgassen nach dem Finden eines Gegenbeispiels meist verborgen
    • Mehr Zeit zu geben wird nicht dazu führen, dass LLMs menschliche Mathematik betreiben und komplexe Zahlen oder überhaupt Zahlen aus dem Nichts erschaffen
      Daran ändert auch nichts, sie noch so lange Dinge aus den Trainingsdaten kombinieren zu lassen
  • Wie ich schon früher gesagt habe: AI wird einen Fields Medal gewinnen, bevor sie ein McDonald's führt
    Der schwierige Teil war, ein Schachbrett für Mathematik zu bauen, also eine Umgebung wie Lean, und jetzt geht es um Mustererkennung und Berechnung
    LLMs sind erst der Anfang; bald werden spezialisiertere Mathematik-AIs kommen, die eher an Stockfish erinnern

    • Aber das hier wurde nicht mit Lean verifiziert
      Es lief rein über natürlichsprachliche Eingaben und Ausgaben, und in vieler Hinsicht ist es eher eine ziemlich interessante Demonstration des Gegenteils
      Verifikation kommt ins Spiel, wenn man auch die Prüfung des Beweises an den Computer abgeben will
      Dieser Beweis wurde derzeit von einer Gruppe von Mathematikern aus dem betreffenden Fachgebiet von Hand geprüft
    • Die Formulierung, McDonald's zu führen, hat so einen dystopischen Beiklang, weil sie mich an das fiktive Managementsystem „Manna“ [0] in einer Hamburger-Franchise erinnert
      Darin steckte viel „umgekehrte Zentaur“-Automatisierung
      Manna hatte jederzeit eine Liste dessen, was gerade zu tun war, und wenn an der Kasse eine Bestellung einging, wies es den Mitarbeitern an, diese Mahlzeit zuzubereiten
      Es verfolgte Hunderte Aufgaben wie Toiletten putzen, Böden wischen, Tische abwischen, Gehwege kehren, Brötchen auftauen, Lagerbestände rotieren und Fenster putzen und wies sie den Mitarbeitern einzeln zu
      Am Ende einer Schicht sagte Manna immer „Für heute sind wir fertig. Danke für Ihre Hilfe“, und man nahm das Headset ab und legte es in die Ladestation
      Weil einem 6–8 Stunden lang eine Stimme im Kopf extrem detailliert gesagt hatte, was zu tun ist, war man in den ersten Minuten nach dem Absetzen des Headsets immer verwirrt und musste das Gehirn erst wieder einschalten, um das Restaurant zu verlassen
      [0] https://en.wikipedia.org/wiki/Manna_(novel)
    • Sehe ich anders. AI wird vielleicht eher Fields-Medal-würdige Dinge leisten, bevor sie McDonald's führt, aber McDonald's gut führen wird sie wahrscheinlich noch vor beidem können
      Fields-Medal-Niveau käme erst deutlich später
    • Der Beweis wurde nicht in Lean geschrieben, sondern auf Englisch
      Um zu prüfen, ob er kein Unsinn ist, braucht man Verifikation durch menschliche Experten
    • Ein „Schachbrett“ für Mathematik gibt es schon seit über 40 Jahren
      Lean ist hier nichts Besonderes, das ist eher Herdentrieb
      Außerdem wissen wir nicht, wie sehr Lean-Training diesem konkreten Modell überhaupt geholfen hat
  • Dieser Beweis wendet unerwartete und raffinierte Ideen der algebraischen Zahlentheorie auf eine Frage der elementaren Geometrie an
    Je mehr ich über solche Leistungen lese, desto mehr habe ich das Gefühl, dass ein großer Teil der Stärke des Modells darin liegt, Vorwissen aus praktisch allen möglichen Disziplinen zu haben und es problemlos in neue Gebiete zu übertragen
    Die potenzielle Schönheit dieser Werkzeuge liegt darin, dass sie helfen könnten, die überzogenen Barrieren extremer Spezialisierung in der heutigen Wissenschaft zu durchbrechen
    Extreme Spezialisierung ist einerseits wichtig, andererseits beschränkt sie die Werkzeuge und Inspirationen, auf die eine Person Zugriff hat

    • Genauso ist es, und gut erklärt
      Je stärker wir uns hyper-spezialisieren, desto wertvoller werden LLMs als Werkzeug, um verschiedene Horizonte zusammenzubringen
    • Das Gesamtwissen der Menschheit wirkt wie eine Art kollektive Intelligenz
      Früher war der Zugang dazu teuer, jetzt ist das nicht mehr so
      Das Coole ist: Wenn jemand etwas zur kollektiven Intelligenz beiträgt, kann es sofort auf jedes Problem angewendet werden, an dem andere gerade arbeiten
    • Bei der Rolle von LLMs in der Mathematik war ich immer skeptisch, aber dieses Argument habe ich zum ersten Mal gesehen und finde es ziemlich überzeugend
      Vielleicht können LLMs helfen, ein stärker horizontales Verständnis eines Fachgebiets zu entwickeln
    • Stimmt. Vielleicht weil ihr Blickfeld begrenzt ist, konzentrieren sich Menschen eher auf Tiefe und weniger auf Breite
      Da dies ein Generalist-Modell ist, verfügt es auch in Physik, Biologie, Geschichte usw. über Wissen auf oder über Promotionsniveau
      Ich glaube, wir verstehen noch nicht wirklich, wie viel ein einzelner „Geist“ leisten kann, der Wissen aus so vielen Bereichen internalisiert hat
  • Als OpenAI sagte, das Modell werde „Intelligenz auf Promotionsniveau“ entwickeln, haben alle gelacht; interessant ist, dass der Maßstab inzwischen bei neue Mathematik erschaffen angekommen ist
    Man verlangt also nicht mehr Promotionsniveau, sondern eher Leibniz-, Euler- oder Galois-Niveau

    • Trotzdem codet es wie ein Junior-Entwickler, der ganz Stack Overflow auswendig gelernt hat
  • Die zusammengefasste Gedankenkette dieser Arbeit, die im Blogpost verlinkt ist, umfasst 125 Seiten
    Das ist ein absurd großes Reasoning-Scaling, ziemlich ähnlich zu dem, was Anthropic mit Mythos angedeutet hatte

  • Ich frage mich, warum man immer nur davon hört, dass Erdős-Probleme gelöst werden
    In der Mathematik gibt es doch zahllose ungelöste Probleme, aber die „mathematischen Durchbrüche“ von ChatGPT, die ich in r/singularity und r/accelerate sehe, sind immer Erdős-Probleme

    • Erdős-Probleme machen einen erheblichen Teil explizit formulierter, aber ungelöster mathematischer Probleme aus
      Sie sind bekannt genug, dass Leute darauf anspringen, und gleichzeitig oft nicht so interessant, dass Menschen enorm viel Mühe hineinstecken würden
      Ein bereits von jemand anderem formuliertes Problem zu lösen, ist in der mathematischen Forschung eher eine Nischenaktivität
      Häufiger untersucht man interessante Objekte, rahmt sie so, dass sie mit den verfügbaren Werkzeugen bearbeitbar sind, und versucht dann, Lösungen zu finden
      Im Idealfall werden Problemstellung und Lösung beide für sich interessant
    • Erdős-Probleme lassen sich leicht beschreiben und sind deshalb ein großartiger Benchmark für das erste Jahr der AI-Mathematik
    • Soweit ich weiß, weil es darum herum eine Community und eine Datenbank gibt
    • Es sind nicht nur Erdős-Probleme: https://news.ycombinator.com/item?id=48213189
    • Erdős-Probleme sind berühmt, weil Erdős ein großartiger Mathematiker war
      Ähnlich wie die Hilbert-Probleme vor einem Jahrhundert
  • Beeindruckend ist es auf jeden Fall
    Aber solange wir nicht wissen, womit dieses Modell trainiert wurde, ist es sehr schwer zu beurteilen, in welchem Maß es tatsächlich „selbst“ dorthin gelangt ist
    Die gesamte AI-Branche hat Experten aus vielen Bereichen viel Geld dafür bezahlt, große Mengen neuer Trainingsdaten zu erzeugen
    Das sind neue Trainingsdaten, die man nirgendwo finden kann; Unternehmen horten sie, und sie könnten durchaus wirklich originelle Ideen enthalten
    Es ist unwahrscheinlich, dass jemand genau dieses Problem bereits gelöst und einfach in die Trainingsdaten gepackt hat, aber ehrlich gesagt kann ich bei OpenAI auch nicht sicher sagen, dass sie es auf keinen Fall getan hätten
    Noch interessanter ist die Möglichkeit, dass sie Trainingsdaten erzeugt haben, die die meisten oder sogar alle zentralen Aussagen berühren, die in diesem Beweis „originell“ wirken
    Natürlich wissen wir es nicht
    Aber solange solche Dinge nicht auf nicht-geheime Weise entstehen, wird diese Frage immer im Raum stehen

    • Das wirkt ziemlich nach einer verschwörungstheoretischen Lesart