- Es wird gezeigt, dass ein einzelner binärer Operator der Form exp(x) − ln(y), EML, alle Elementarfunktionen und Konstanten erzeugen kann
- Mit diesem Operator und nur der Konstante 1 lassen sich arithmetische Operationen, transzendente Funktionen (sin, cos, log, √ usw.) sowie komplexe Konstanten (e, π, i) vollständig ausdrücken
- Alle EML-Ausdrücke bestehen aus binären Bäumen mit identischer Knotenstruktur und können daher für symbolische Regression und gradientenbasiertes Lernen genutzt werden
- EML ist das mathematische Gegenstück zum NAND-Gatter und fungiert in der kontinuierlichen Mathematik als einziger universeller Operator
- Die Entdeckung zeigt, dass sich alle Elementarfunktionen auf eine einzige Erzeugungsregel zurückführen lassen, und eröffnet neue Möglichkeiten für Formelsuche und symbolische KI
Definition des einzelnen binären Operators EML
- Es wird gezeigt, dass ein einzelner binärer Operator der Form eml(x, y) = exp(x) − ln(y) alle Elementarfunktionen erzeugen kann
- Mit diesem Operator und nur der Konstante 1 lassen sich arithmetische Operationen (+, −, ×, /, Potenzen), transzendente Funktionen (sin, cos, log, √ usw.) sowie Konstanten (e, π, i) vollständig ausdrücken
- Beispielsweise lässt sich e^x = eml(x, 1) und ln x = eml(1, eml(eml(1, x), 1)) schreiben
- Der Operator EML (Exp–Minus–Log) rechnet im komplexen Bereich (C)
- Die Konstante 1 dient dazu, über ln(1)=0 den Logarithmus-Term zu neutralisieren
- Über die Berechnung von ln(−1) lassen sich komplexe Konstanten wie i und π erzeugen
- Der Operator wird als einziger grundlegender Operator der kontinuierlichen Mathematik vorgestellt, analog zum NAND-Gatter in der digitalen Logik
- So wie NAND die gesamte boolesche Logik aufbauen kann, kann EML alle Elementarfunktionen aufbauen
Das Konzept eines Rechners auf Basis eines einzelnen Operators
- Vorgestellt wird das Konzept eines „Zwei-Tasten-Rechners“
- Mit nur einem binären Operator (EML) und einer Konstanten (1) lassen sich sämtliche Funktionen eines wissenschaftlichen Taschenrechners ausführen
- Auch ohne weitere Operatoren können alle reellen und komplexen Elementarfunktionen berechnet werden
- Eine weitere Reduktion der Anzahl an Operatoren ist nicht möglich
- Mindestens ein binärer Operator und ein terminals Symbol (eine Konstante) sind notwendig
Strukturelle Eigenschaften von EML-Ausdrücken
- Alle EML-Ausdrücke haben die Struktur eines binären Baums mit identischen Knoten
- Grammatikform: S → 1 | eml(S, S)
- Das lässt sich als kontextfreie Sprache interpretieren, die isomorph zu Catalan-Strukturen und vollständigen binären Bäumen ist
- Diese einheitliche Struktur ermöglicht in der symbolischen Regression die Anwendung gradientenbasierter Optimierung (z. B. Adam)
- EML-Bäume können als lernbare Schaltungen verwendet werden, um bei geringer Baumtiefe (maximal 4) exakte geschlossene Formen von Elementarfunktionen zu rekonstruieren
- Wenn das Erzeugungsgesetz elementar ist, können die gelernten Gewichte zur exakten Formelgestalt konvergieren
Entdeckungsprozess und mathematische Implikationen
- Der Operator EML wurde durch systematische vollständige Suche (exhaustive search) entdeckt
- Das Suchergebnis bestätigte, dass EML eine vollständige Operationsbasis für den wissenschaftlichen Taschenrechner bildet
- Verwendet wurde ein „kaputter Taschenrechner“-(broken calculator)-Ansatz, bei dem die Anzahl der Operatoren schrittweise reduziert wurde
- Die Menge wurde von 4 → 3 → 2 → 1 Operator verkleinert, während die volle Funktionalität erhalten blieb
- EML besitzt eine unerwartete Einfachheit und ist selbst ein durch Elementarfunktionen definierter binärer Operator
- Die Existenz von EML zeigt, dass Elementarfunktionen zu einer deutlich einfacheren generativen Hierarchie gehören
- Sie erweitert die Reduktion verschiedenster Funktionen auf Kombinationen aus exp und ln
- Da sich alle mathematischen Ausdrücke durch eine einzige wiederholbare Komponente darstellen lassen,
- wird eine schaltungsartige Darstellung mathematischer Formeln möglich, ähnlich zum transistorbasierten Aufbau elektronischer Schaltungen
- Diese homogene Schaltungsdarstellung eröffnet neue Möglichkeiten für Formelsuche, Auswertung und Lernen
Verwandte Konzepte und historischer Kontext
- Die Universalität eines einzelnen Grundbausteins ist in Mathematik, Ingenieurwesen und Biologie ein wichtiges Konzept
- Beispiele: NAND/NOR-Gatter, ReLU-Aktivierungsfunktion, K,S-Kombinatoren, OISC(SUBLEQ), zellulärer Automat Rule 110 usw.
- Sheffer-artige Elemente sind selten, und ihre Entdeckung erfordert Zeit, Rechenleistung und Glück
- EML wird als ein Beispiel eines solchen Sheffer-artigen kontinuierlichen Operators vorgestellt
- Der Ansatz baut auf bekannten Reduktionsbeziehungen auf, etwa der wechselseitigen Darstellbarkeit von Logarithmus und Exponentialfunktion (x×y = e^{ln x + ln y}, x+y = ln(e^x × e^y)) sowie der Euler-Formel (e^{iφ} = cos φ + i sin φ)
Menge der Elementarfunktionen und künftige Erweiterungen
- Die Arbeit nimmt zunächst die Menge der Elementarfunktionen auf dem Niveau eines wissenschaftlichen Taschenrechners als Ausgangspunkt
- Konstanten: π, e, i, −1, 1, 2, x, y
- Unäre Funktionen: exp, ln, inv(1/x), minus(−x), √, sqr(x²), σ(1/(1+e^−x)), sin, cos, tan, arcsin, arccos, arctan, sinh, cosh, tanh usw.
- Binäre Operationen: +, −, ×, /, log, pow(x^y), avg((x+y)/2), hypot(√(x²+y²))
- Es wird bewiesen, dass diese gesamte Menge vollständig durch den einzelnen Operator EML und die Konstante 1 ersetzt werden kann
- In der frühen Suche wurden auch ähnliche Operatoren mit noch stärkeren Eigenschaften gefunden
- Beispiel: eine ternäre Variante, die keine Konstanten benötigt
- EML wird als Ausgangspunkt präsentiert, der die Möglichkeit eines einzigen erzeugenden Operators für die kontinuierliche Mathematik aufzeigt
- Daraus ergeben sich vielfältige mögliche Anwendungen, etwa für automatische Formelerkennung, symbolische KI und die Optimierung mathematischer Darstellungen
2 Kommentare
Als Formel ausgedrückt also wohl $eml(x, y) = e^x - ln(x)$.
Allerdings dürfte das erst dann richtig zur Geltung kommen, wenn ein Prozessor erscheint, der $e^x$ oder $ln(x)$ auf einmal berechnen kann.
Hacker-News-Kommentare
Dieser Ansatz ist nicht besonders oder der rechnerisch sparsamste Weg
Wenn man zum Beispiel f(x, y) = 1/(x - y) definiert, wird auch das zu einem universellen Operator
Setzt man x#y = 1/(x - y), dann erhält man mit x#0 = 1/x den Kehrwert, und mit (x#y)#0 = x - y lässt sich die Subtraktion ausdrücken
Dass man allein aus Kehrwert und Subtraktion die vier Grundrechenarten aufbauen kann, ist eine bekannte Übung
Einen kurzen Beweis dazu gibt es in dieser Notiz
Es freut mich, eine Idee in FRACTRAN-Form auf der Startseite zu sehen
Mich erinnert das an die Kodierung eines 1-Bit-Stacks als Binärzahl.
Ein push von 0 verdoppelt die Zahl, ein push von 1 verdoppelt sie und addiert danach 1. pop entspricht einer Division durch 2
Ich benutze eine konkatenative Sprache namens Rejoice, die auf solchen Ideen aufbaut. Daten werden als Multimengen dargestellt, die durch Multiplikation zusammengesetzt werden
Rejoice-Wiki
Das ist ein guter Benchmark, um die Leistung von LLMs zu testen
Opus(paid) scheiterte mit der Begründung, „2“ sei zirkulär, aber ChatGPT hat es offenbar schon geschafft
ChatGPT(free) schaffte es sofort, Grok machte eine Tiefenschätzung, Gemini schaffte es, Deepseek konnte das PDF nicht laden, Kimi blieb unterwegs stehen, GLM war ordentlich
Ich habe 36 verschiedene zweistufige EML-Funktionen einer einzelnen Variablen visualisiert
Die ersten 18 liefern reelle Ausgaben, die übrigen enthalten unterwegs komplexe Werte
Bildlink
Alte Funktionentabellen aus Mathematikbüchern ließen sich dann vielleicht als einfacher Hash-Lookup neu interpretieren
Die Aussage „Mit EML und der Zahl 1 kann man jede Berechnung ausdrücken“ erinnert mich an den Iota-Kombinator
Das ähnelt der Idee, mit einem minimalen formalen System Turing-Vollständigkeit zu erreichen
Der aktuelle Paper-Link ist noch v1 und ohne Abbildungen. Er sollte auf v2 geändert werden
Ich lese noch, aber wenn das stimmt, könnte es eine große Entdeckung seit Jahren sein
Wenn man Daten oder Wellenfunktionen statt mit Splines oder Polynomen mit EML-Bäumen fitten könnte,
ließen sich auch mehrvariable Funktionen per gradient descent lernen und in EML-Approximationbäume umwandeln
Man könnte sogar so trainieren, dass die Ableitungsbedingungen der Schrödinger-Gleichung erfüllt werden
Es wirkt fast zu gut, um wahr zu sein, aber so etwas ist tatsächlich schon vorgekommen
Schon um eine einzelne Multiplikation auszudrücken, braucht man einen Baum der Tiefe 8 und mehr als 41 Blätter
Es gibt einen Trade-off zwischen der Eleganz einer minimalen Operationsmenge und der Länge des Ausdrucks
Ich habe mit einem Ansatz gearbeitet, der Operadentheorie und Kategorientheorie nutzt, um spektrale neuronale Netze mit symbolic regression zu verbinden
Polynome sind bei hoher Ausdruckskraft rechnerisch schnell
Das, was du beschreibst, ähnelt bestehender symbolic regression. Das ist bereits ein ausgereiftes Feld
Trotzdem ist es eine sehr interessante Entdeckung
Die Herleitung von -x scheint fehlerhaft zu sein
Wenn man den Ausführungsablauf der Stack-Maschine verfolgt, ergibt sich eml(z, eml(x,1)) = e^z - x,
und damit das zu -x wird, müsste e^z = 0 gelten. Aber ein solches komplexes z existiert nicht
Wenn man z tatsächlich ausformuliert, landet man bei Problemen wie ln(0). Bei x^-1 ist es ähnlich
Falls man Annahmen wie ln(0)=∞ und x/∞=0 zulässt, funktioniert es „halbwegs plausibel“
Verfolgt man die Rechenschritte, ergibt sich ln(1)=0 → e-ln(0)=+∞ → e-ln(+∞)=-∞
Mir kommen dazu einige interessante Ideen
Aus Spaß habe ich gestern das Projekt emlvm gebaut
Die Stelle „Mit EML-Bäumen der Tiefe 4 oder weniger ist eine Wiederherstellung geschlossener Formen möglich“ ist wirklich großartig
Ich habe mich immer gefragt, ob so etwas machbar ist