Alle Elementarfunktionen aus einem einzigen binären Operator erzeugt

(arxiv.org)

7 Punkte von GN⁺ 16 일 전 | 2 Kommentare | Auf WhatsApp teilen

Es wird gezeigt, dass ein einzelner binärer Operator der Form exp(x) − ln(y), EML, alle Elementarfunktionen und Konstanten erzeugen kann
Mit diesem Operator und nur der Konstante 1 lassen sich arithmetische Operationen, transzendente Funktionen (sin, cos, log, √ usw.) sowie komplexe Konstanten (e, π, i) vollständig ausdrücken
Alle EML-Ausdrücke bestehen aus binären Bäumen mit identischer Knotenstruktur und können daher für symbolische Regression und gradientenbasiertes Lernen genutzt werden
EML ist das mathematische Gegenstück zum NAND-Gatter und fungiert in der kontinuierlichen Mathematik als einziger universeller Operator
Die Entdeckung zeigt, dass sich alle Elementarfunktionen auf eine einzige Erzeugungsregel zurückführen lassen, und eröffnet neue Möglichkeiten für Formelsuche und symbolische KI

Definition des einzelnen binären Operators EML

Es wird gezeigt, dass ein einzelner binärer Operator der Form eml(x, y) = exp(x) − ln(y) alle Elementarfunktionen erzeugen kann
- Mit diesem Operator und nur der Konstante 1 lassen sich arithmetische Operationen (+, −, ×, /, Potenzen), transzendente Funktionen (sin, cos, log, √ usw.) sowie Konstanten (e, π, i) vollständig ausdrücken
- Beispielsweise lässt sich e^x = eml(x, 1) und ln x = eml(1, eml(eml(1, x), 1)) schreiben
Der Operator EML (Exp–Minus–Log) rechnet im komplexen Bereich (C)
- Die Konstante 1 dient dazu, über ln(1)=0 den Logarithmus-Term zu neutralisieren
- Über die Berechnung von ln(−1) lassen sich komplexe Konstanten wie i und π erzeugen
Der Operator wird als einziger grundlegender Operator der kontinuierlichen Mathematik vorgestellt, analog zum NAND-Gatter in der digitalen Logik
- So wie NAND die gesamte boolesche Logik aufbauen kann, kann EML alle Elementarfunktionen aufbauen

Das Konzept eines Rechners auf Basis eines einzelnen Operators

Vorgestellt wird das Konzept eines „Zwei-Tasten-Rechners“
- Mit nur einem binären Operator (EML) und einer Konstanten (1) lassen sich sämtliche Funktionen eines wissenschaftlichen Taschenrechners ausführen
- Auch ohne weitere Operatoren können alle reellen und komplexen Elementarfunktionen berechnet werden
Eine weitere Reduktion der Anzahl an Operatoren ist nicht möglich
- Mindestens ein binärer Operator und ein terminals Symbol (eine Konstante) sind notwendig

Strukturelle Eigenschaften von EML-Ausdrücken

Alle EML-Ausdrücke haben die Struktur eines binären Baums mit identischen Knoten
- Grammatikform: S → 1 | eml(S, S)
- Das lässt sich als kontextfreie Sprache interpretieren, die isomorph zu Catalan-Strukturen und vollständigen binären Bäumen ist
Diese einheitliche Struktur ermöglicht in der symbolischen Regression die Anwendung gradientenbasierter Optimierung (z. B. Adam)
- EML-Bäume können als lernbare Schaltungen verwendet werden, um bei geringer Baumtiefe (maximal 4) exakte geschlossene Formen von Elementarfunktionen zu rekonstruieren
- Wenn das Erzeugungsgesetz elementar ist, können die gelernten Gewichte zur exakten Formelgestalt konvergieren

Entdeckungsprozess und mathematische Implikationen

Der Operator EML wurde durch systematische vollständige Suche (exhaustive search) entdeckt
- Das Suchergebnis bestätigte, dass EML eine vollständige Operationsbasis für den wissenschaftlichen Taschenrechner bildet
Verwendet wurde ein „kaputter Taschenrechner“-(broken calculator)-Ansatz, bei dem die Anzahl der Operatoren schrittweise reduziert wurde
- Die Menge wurde von 4 → 3 → 2 → 1 Operator verkleinert, während die volle Funktionalität erhalten blieb
EML besitzt eine unerwartete Einfachheit und ist selbst ein durch Elementarfunktionen definierter binärer Operator
Die Existenz von EML zeigt, dass Elementarfunktionen zu einer deutlich einfacheren generativen Hierarchie gehören
- Sie erweitert die Reduktion verschiedenster Funktionen auf Kombinationen aus exp und ln
Da sich alle mathematischen Ausdrücke durch eine einzige wiederholbare Komponente darstellen lassen,
- wird eine schaltungsartige Darstellung mathematischer Formeln möglich, ähnlich zum transistorbasierten Aufbau elektronischer Schaltungen
Diese homogene Schaltungsdarstellung eröffnet neue Möglichkeiten für Formelsuche, Auswertung und Lernen

Menge der Elementarfunktionen und künftige Erweiterungen

Die Arbeit nimmt zunächst die Menge der Elementarfunktionen auf dem Niveau eines wissenschaftlichen Taschenrechners als Ausgangspunkt
- Konstanten: π, e, i, −1, 1, 2, x, y
- Unäre Funktionen: exp, ln, inv(1/x), minus(−x), √, sqr(x²), σ(1/(1+e^−x)), sin, cos, tan, arcsin, arccos, arctan, sinh, cosh, tanh usw.
- Binäre Operationen: +, −, ×, /, log, pow(x^y), avg((x+y)/2), hypot(√(x²+y²))
Es wird bewiesen, dass diese gesamte Menge vollständig durch den einzelnen Operator EML und die Konstante 1 ersetzt werden kann
In der frühen Suche wurden auch ähnliche Operatoren mit noch stärkeren Eigenschaften gefunden
- Beispiel: eine ternäre Variante, die keine Konstanten benötigt
EML wird als Ausgangspunkt präsentiert, der die Möglichkeit eines einzigen erzeugenden Operators für die kontinuierliche Mathematik aufzeigt
- Daraus ergeben sich vielfältige mögliche Anwendungen, etwa für automatische Formelerkennung, symbolische KI und die Optimierung mathematischer Darstellungen

2 Kommentare

carnoxen 14 일 전

Als Formel ausgedrückt also wohl $eml(x, y) = e^x - ln(x)$.

Allerdings dürfte das erst dann richtig zur Geltung kommen, wenn ein Prozessor erscheint, der $e^x$ oder $ln(x)$ auf einmal berechnen kann.

GN⁺ 16 일 전

Hacker-News-Kommentare

Dieser Ansatz ist nicht besonders oder der rechnerisch sparsamste Weg
Wenn man zum Beispiel f(x, y) = 1/(x - y) definiert, wird auch das zu einem universellen Operator
Setzt man x#y = 1/(x - y), dann erhält man mit x#0 = 1/x den Kehrwert, und mit (x#y)#0 = x - y lässt sich die Subtraktion ausdrücken
Dass man allein aus Kehrwert und Subtraktion die vier Grundrechenarten aufbauen kann, ist eine bekannte Übung
Einen kurzen Beweis dazu gibt es in dieser Notiz
- Der interessante Teil ist, dass dieser Ansatz sogar die Konstanten e, π, i einschließt. Er behandelt Addition, Multiplikation, Exponentialfunktion, Logarithmus und weitere transzendente Funktionen
- Die von dir genannte Methode mit f(x, y) braucht Grenzwerte (limits), um bestimmte Konzepte auszudrücken, während der EML-Ansatz als Berechnungsbaumstruktur formuliert ist, die ein Systemmodell ausdrückt
- Gute Entdeckung. Es wird auf eine Arbeit von 1935 verwiesen (PNAS-Paper), und die Diskussion dazu geht auch auf MathOverflow weiter
- Dann frage ich mich, ob sich in so einer Einzeldarstellung auch trigonometrische Funktionen herleiten lassen
- Aber mit dieser Methode dürften Standardkonstanten oder Ausdrücke in geschlossener Form wie e, π, exp oder log schwer zu behandeln sein
Es freut mich, eine Idee in FRACTRAN-Form auf der Startseite zu sehen
Mich erinnert das an die Kodierung eines 1-Bit-Stacks als Binärzahl.
Ein push von 0 verdoppelt die Zahl, ein push von 1 verdoppelt sie und addiert danach 1. pop entspricht einer Division durch 2
Ich benutze eine konkatenative Sprache namens Rejoice, die auf solchen Ideen aufbaut. Daten werden als Multimengen dargestellt, die durch Multiplikation zusammengesetzt werden
Rejoice-Wiki
- Müsste man nicht die Größe des Stacks mitverfolgen, um zu wissen, ob es führende Nullen gibt?
- Die Erklärung klingt gerade so, als würdest du einfach das Grundprinzip des Binärsystems neu beschreiben
Das ist ein guter Benchmark, um die Leistung von LLMs zu testen
```
Paper: https://arxiv.org/pdf/2603.21852
Drücke "2x + y" als EML-Kombination aus
```
Opus(paid) scheiterte mit der Begründung, „2“ sei zirkulär, aber ChatGPT hat es offenbar schon geschafft
ChatGPT(free) schaffte es sofort, Grok machte eine Tiefenschätzung, Gemini schaffte es, Deepseek konnte das PDF nicht laden, Kimi blieb unterwegs stehen, GLM war ordentlich
- Heute habe ich gelernt, dass LLMs besser werden, wenn man sie provoziert (taunt). Offenbar haben sie einen Wettbewerbsinstinkt
- Ich habe bei DeepSeek nur das Abstract hineinkopiert, und es hat trotzdem ein Ergebnis geliefert. Ihm Punkte abzuziehen, weil es das PDF nicht kannte, ist unfair
- Wenn du solche Experimente magst, solltest du vielleicht zu Terminal Bench Science beitragen
- Ich habe den Prompt so geändert:
```
eml(x,y)=exp(x)−ln(y)
Drücke sin(x)/x mit EML und der Konstante 1 aus
```
- Der instant-Modus von meta.ai schaffte es ebenfalls auf Anhieb
```
2x + y = \operatorname{eml}\Big(1,\; \operatorname{eml}\big(\operatorname{eml}(1,\; \operatorname{eml}(\operatorname{eml}(1,\; \operatorname{eml}(\operatorname{eml}(L_2 + L_x, 1), 1) \cdot \operatorname{eml}(y,1)),1)\big),1\big)\Big)
```
  Gemini verwechselte EML mit „elementary mathematical layers“
Ich habe 36 verschiedene zweistufige EML-Funktionen einer einzelnen Variablen visualisiert
Die ersten 18 liefern reelle Ausgaben, die übrigen enthalten unterwegs komplexe Werte
Bildlink
- Es wäre interessant, alle Binärbaumfunktionen mit fester Tiefe vollständig zu klassifizieren und die Bäume als Binärzahlen zu kodieren
  Alte Funktionentabellen aus Mathematikbüchern ließen sich dann vielleicht als einfacher Hash-Lookup neu interpretieren
Die Aussage „Mit EML und der Zahl 1 kann man jede Berechnung ausdrücken“ erinnert mich an den Iota-Kombinator
Das ähnelt der Idee, mit einem minimalen formalen System Turing-Vollständigkeit zu erreichen
Der aktuelle Paper-Link ist noch v1 und ohne Abbildungen. Er sollte auf v2 geändert werden
Ich lese noch, aber wenn das stimmt, könnte es eine große Entdeckung seit Jahren sein
Wenn man Daten oder Wellenfunktionen statt mit Splines oder Polynomen mit EML-Bäumen fitten könnte,
ließen sich auch mehrvariable Funktionen per gradient descent lernen und in EML-Approximationbäume umwandeln
Man könnte sogar so trainieren, dass die Ableitungsbedingungen der Schrödinger-Gleichung erfüllt werden
Es wirkt fast zu gut, um wahr zu sein, aber so etwas ist tatsächlich schon vorgekommen
- Nach meiner Erfahrung aus einem Jahr Forschung in diesem Bereich ist EML mächtig, aber das Problem ist die Explosion der Ausdrucksgröße
  Schon um eine einzelne Multiplikation auszudrücken, braucht man einen Baum der Tiefe 8 und mehr als 41 Blätter
  Es gibt einen Trade-off zwischen der Eleganz einer minimalen Operationsmenge und der Länge des Ausdrucks
  Ich habe mit einem Ansatz gearbeitet, der Operadentheorie und Kategorientheorie nutzt, um spektrale neuronale Netze mit symbolic regression zu verbinden
- Das ist derselbe Grund, aus dem man nicht die gesamte boolesche Logik nur mit NAND implementiert. Es geht um Recheneffizienz
  Polynome sind bei hoher Ausdruckskraft rechnerisch schnell
- Das Paper ist interessant und elegant, aber keine wettbewerbsfähige Alternative für Regression oder Optimierung
  Das, was du beschreibst, ähnelt bestehender symbolic regression. Das ist bereits ein ausgereiftes Feld
- Der EML-basierte Ansatz ist cool, aber selbst einfache Funktionen wie + sind nur schwer auszudrücken
  Trotzdem ist es eine sehr interessante Entdeckung
- Ein netter Trick, aber als bahnbrechende Entdeckung wirkt das etwas übertrieben
Die Herleitung von -x scheint fehlerhaft zu sein
Wenn man den Ausführungsablauf der Stack-Maschine verfolgt, ergibt sich eml(z, eml(x,1)) = e^z - x,
und damit das zu -x wird, müsste e^z = 0 gelten. Aber ein solches komplexes z existiert nicht
Wenn man z tatsächlich ausformuliert, landet man bei Problemen wie ln(0). Bei x^-1 ist es ähnlich
Falls man Annahmen wie ln(0)=∞ und x/∞=0 zulässt, funktioniert es „halbwegs plausibel“
- Der Autor erwähnt die RPN-Notation, liefert die Formeln aber nur als Bilder, was unpraktisch ist
  Verfolgt man die Rechenschritte, ergibt sich ln(1)=0 → e-ln(0)=+∞ → e-ln(+∞)=-∞
- Das Paper erkennt dieses Problem selbst an. Ich habe zu schnell geurteilt
Mir kommen dazu einige interessante Ideen
1. Wenn man den Betrag über sqrt(x*x) hinzunimmt, lassen sich auch min, max und signum herleiten
2. Wenn f(x) und f⁻¹(x) bijektive Funktionen sind, die sich mit eml() ausdrücken lassen, könnte man mit eml(f(x), f(y)) und f⁻¹(1) eine weitere universelle Grundlage bauen
3. Statt des natürlichen Logarithmus könnte eine Grundlage der Form 2^x - log₂(y) rechnerisch effizienter sein. Das erinnert an Elias omega coding
4. Wenn es einen Algorithmus zur Ableitungsberechnung für eml()-Bäume gäbe, könnte man vielleicht klar beweisen, welche Funktionen kein symbolisches unbestimmtes Integral besitzen
5. Die Erweiterung in den komplexen Bereich könnte auch mit komplexwertiger Fuzzy-Logik zusammenhängen. Vielleicht ließen sich Lukasiewicz- und multiplikative Logik vereinheitlichen
Aus Spaß habe ich gestern das Projekt emlvm gebaut
Die Stelle „Mit EML-Bäumen der Tiefe 4 oder weniger ist eine Wiederherstellung geschlossener Formen möglich“ ist wirklich großartig
Ich habe mich immer gefragt, ob so etwas machbar ist