7 Punkte von GN⁺ 16 일 전 | 2 Kommentare | Auf WhatsApp teilen
  • Es wird gezeigt, dass ein einzelner binärer Operator der Form exp(x) − ln(y), EML, alle Elementarfunktionen und Konstanten erzeugen kann
  • Mit diesem Operator und nur der Konstante 1 lassen sich arithmetische Operationen, transzendente Funktionen (sin, cos, log, √ usw.) sowie komplexe Konstanten (e, π, i) vollständig ausdrücken
  • Alle EML-Ausdrücke bestehen aus binären Bäumen mit identischer Knotenstruktur und können daher für symbolische Regression und gradientenbasiertes Lernen genutzt werden
  • EML ist das mathematische Gegenstück zum NAND-Gatter und fungiert in der kontinuierlichen Mathematik als einziger universeller Operator
  • Die Entdeckung zeigt, dass sich alle Elementarfunktionen auf eine einzige Erzeugungsregel zurückführen lassen, und eröffnet neue Möglichkeiten für Formelsuche und symbolische KI

Definition des einzelnen binären Operators EML

  • Es wird gezeigt, dass ein einzelner binärer Operator der Form eml(x, y) = exp(x) − ln(y) alle Elementarfunktionen erzeugen kann
    • Mit diesem Operator und nur der Konstante 1 lassen sich arithmetische Operationen (+, −, ×, /, Potenzen), transzendente Funktionen (sin, cos, log, √ usw.) sowie Konstanten (e, π, i) vollständig ausdrücken
    • Beispielsweise lässt sich e^x = eml(x, 1) und ln x = eml(1, eml(eml(1, x), 1)) schreiben
  • Der Operator EML (Exp–Minus–Log) rechnet im komplexen Bereich (C)
    • Die Konstante 1 dient dazu, über ln(1)=0 den Logarithmus-Term zu neutralisieren
    • Über die Berechnung von ln(−1) lassen sich komplexe Konstanten wie i und π erzeugen
  • Der Operator wird als einziger grundlegender Operator der kontinuierlichen Mathematik vorgestellt, analog zum NAND-Gatter in der digitalen Logik
    • So wie NAND die gesamte boolesche Logik aufbauen kann, kann EML alle Elementarfunktionen aufbauen

Das Konzept eines Rechners auf Basis eines einzelnen Operators

  • Vorgestellt wird das Konzept eines „Zwei-Tasten-Rechners“
    • Mit nur einem binären Operator (EML) und einer Konstanten (1) lassen sich sämtliche Funktionen eines wissenschaftlichen Taschenrechners ausführen
    • Auch ohne weitere Operatoren können alle reellen und komplexen Elementarfunktionen berechnet werden
  • Eine weitere Reduktion der Anzahl an Operatoren ist nicht möglich
    • Mindestens ein binärer Operator und ein terminals Symbol (eine Konstante) sind notwendig

Strukturelle Eigenschaften von EML-Ausdrücken

  • Alle EML-Ausdrücke haben die Struktur eines binären Baums mit identischen Knoten
    • Grammatikform: S → 1 | eml(S, S)
    • Das lässt sich als kontextfreie Sprache interpretieren, die isomorph zu Catalan-Strukturen und vollständigen binären Bäumen ist
  • Diese einheitliche Struktur ermöglicht in der symbolischen Regression die Anwendung gradientenbasierter Optimierung (z. B. Adam)
    • EML-Bäume können als lernbare Schaltungen verwendet werden, um bei geringer Baumtiefe (maximal 4) exakte geschlossene Formen von Elementarfunktionen zu rekonstruieren
    • Wenn das Erzeugungsgesetz elementar ist, können die gelernten Gewichte zur exakten Formelgestalt konvergieren

Entdeckungsprozess und mathematische Implikationen

  • Der Operator EML wurde durch systematische vollständige Suche (exhaustive search) entdeckt
    • Das Suchergebnis bestätigte, dass EML eine vollständige Operationsbasis für den wissenschaftlichen Taschenrechner bildet
  • Verwendet wurde ein „kaputter Taschenrechner“-(broken calculator)-Ansatz, bei dem die Anzahl der Operatoren schrittweise reduziert wurde
    • Die Menge wurde von 4 → 3 → 2 → 1 Operator verkleinert, während die volle Funktionalität erhalten blieb
  • EML besitzt eine unerwartete Einfachheit und ist selbst ein durch Elementarfunktionen definierter binärer Operator
  • Die Existenz von EML zeigt, dass Elementarfunktionen zu einer deutlich einfacheren generativen Hierarchie gehören
    • Sie erweitert die Reduktion verschiedenster Funktionen auf Kombinationen aus exp und ln
  • Da sich alle mathematischen Ausdrücke durch eine einzige wiederholbare Komponente darstellen lassen,
    • wird eine schaltungsartige Darstellung mathematischer Formeln möglich, ähnlich zum transistorbasierten Aufbau elektronischer Schaltungen
  • Diese homogene Schaltungsdarstellung eröffnet neue Möglichkeiten für Formelsuche, Auswertung und Lernen

Verwandte Konzepte und historischer Kontext

  • Die Universalität eines einzelnen Grundbausteins ist in Mathematik, Ingenieurwesen und Biologie ein wichtiges Konzept
    • Beispiele: NAND/NOR-Gatter, ReLU-Aktivierungsfunktion, K,S-Kombinatoren, OISC(SUBLEQ), zellulärer Automat Rule 110 usw.
  • Sheffer-artige Elemente sind selten, und ihre Entdeckung erfordert Zeit, Rechenleistung und Glück
    • EML wird als ein Beispiel eines solchen Sheffer-artigen kontinuierlichen Operators vorgestellt
  • Der Ansatz baut auf bekannten Reduktionsbeziehungen auf, etwa der wechselseitigen Darstellbarkeit von Logarithmus und Exponentialfunktion (x×y = e^{ln x + ln y}, x+y = ln(e^x × e^y)) sowie der Euler-Formel (e^{iφ} = cos φ + i sin φ)

Menge der Elementarfunktionen und künftige Erweiterungen

  • Die Arbeit nimmt zunächst die Menge der Elementarfunktionen auf dem Niveau eines wissenschaftlichen Taschenrechners als Ausgangspunkt
    • Konstanten: π, e, i, −1, 1, 2, x, y
    • Unäre Funktionen: exp, ln, inv(1/x), minus(−x), √, sqr(x²), σ(1/(1+e^−x)), sin, cos, tan, arcsin, arccos, arctan, sinh, cosh, tanh usw.
    • Binäre Operationen: +, −, ×, /, log, pow(x^y), avg((x+y)/2), hypot(√(x²+y²))
  • Es wird bewiesen, dass diese gesamte Menge vollständig durch den einzelnen Operator EML und die Konstante 1 ersetzt werden kann
  • In der frühen Suche wurden auch ähnliche Operatoren mit noch stärkeren Eigenschaften gefunden
    • Beispiel: eine ternäre Variante, die keine Konstanten benötigt
  • EML wird als Ausgangspunkt präsentiert, der die Möglichkeit eines einzigen erzeugenden Operators für die kontinuierliche Mathematik aufzeigt
    • Daraus ergeben sich vielfältige mögliche Anwendungen, etwa für automatische Formelerkennung, symbolische KI und die Optimierung mathematischer Darstellungen

2 Kommentare

 
carnoxen 14 일 전

Als Formel ausgedrückt also wohl $eml(x, y) = e^x - ln(x)$.

Allerdings dürfte das erst dann richtig zur Geltung kommen, wenn ein Prozessor erscheint, der $e^x$ oder $ln(x)$ auf einmal berechnen kann.

 
GN⁺ 16 일 전
Hacker-News-Kommentare
  • Dieser Ansatz ist nicht besonders oder der rechnerisch sparsamste Weg
    Wenn man zum Beispiel f(x, y) = 1/(x - y) definiert, wird auch das zu einem universellen Operator
    Setzt man x#y = 1/(x - y), dann erhält man mit x#0 = 1/x den Kehrwert, und mit (x#y)#0 = x - y lässt sich die Subtraktion ausdrücken
    Dass man allein aus Kehrwert und Subtraktion die vier Grundrechenarten aufbauen kann, ist eine bekannte Übung
    Einen kurzen Beweis dazu gibt es in dieser Notiz

    • Der interessante Teil ist, dass dieser Ansatz sogar die Konstanten e, π, i einschließt. Er behandelt Addition, Multiplikation, Exponentialfunktion, Logarithmus und weitere transzendente Funktionen
    • Die von dir genannte Methode mit f(x, y) braucht Grenzwerte (limits), um bestimmte Konzepte auszudrücken, während der EML-Ansatz als Berechnungsbaumstruktur formuliert ist, die ein Systemmodell ausdrückt
    • Gute Entdeckung. Es wird auf eine Arbeit von 1935 verwiesen (PNAS-Paper), und die Diskussion dazu geht auch auf MathOverflow weiter
    • Dann frage ich mich, ob sich in so einer Einzeldarstellung auch trigonometrische Funktionen herleiten lassen
    • Aber mit dieser Methode dürften Standardkonstanten oder Ausdrücke in geschlossener Form wie e, π, exp oder log schwer zu behandeln sein
  • Es freut mich, eine Idee in FRACTRAN-Form auf der Startseite zu sehen
    Mich erinnert das an die Kodierung eines 1-Bit-Stacks als Binärzahl.
    Ein push von 0 verdoppelt die Zahl, ein push von 1 verdoppelt sie und addiert danach 1. pop entspricht einer Division durch 2
    Ich benutze eine konkatenative Sprache namens Rejoice, die auf solchen Ideen aufbaut. Daten werden als Multimengen dargestellt, die durch Multiplikation zusammengesetzt werden
    Rejoice-Wiki

    • Müsste man nicht die Größe des Stacks mitverfolgen, um zu wissen, ob es führende Nullen gibt?
    • Die Erklärung klingt gerade so, als würdest du einfach das Grundprinzip des Binärsystems neu beschreiben
  • Das ist ein guter Benchmark, um die Leistung von LLMs zu testen

    Paper: https://arxiv.org/pdf/2603.21852
    Drücke "2x + y" als EML-Kombination aus
    

    Opus(paid) scheiterte mit der Begründung, „2“ sei zirkulär, aber ChatGPT hat es offenbar schon geschafft
    ChatGPT(free) schaffte es sofort, Grok machte eine Tiefenschätzung, Gemini schaffte es, Deepseek konnte das PDF nicht laden, Kimi blieb unterwegs stehen, GLM war ordentlich

    • Heute habe ich gelernt, dass LLMs besser werden, wenn man sie provoziert (taunt). Offenbar haben sie einen Wettbewerbsinstinkt
    • Ich habe bei DeepSeek nur das Abstract hineinkopiert, und es hat trotzdem ein Ergebnis geliefert. Ihm Punkte abzuziehen, weil es das PDF nicht kannte, ist unfair
    • Wenn du solche Experimente magst, solltest du vielleicht zu Terminal Bench Science beitragen
    • Ich habe den Prompt so geändert:
      eml(x,y)=exp(x)−ln(y)
      Drücke sin(x)/x mit EML und der Konstante 1 aus
      
    • Der instant-Modus von meta.ai schaffte es ebenfalls auf Anhieb
      2x + y = \operatorname{eml}\Big(1,\; \operatorname{eml}\big(\operatorname{eml}(1,\; \operatorname{eml}(\operatorname{eml}(1,\; \operatorname{eml}(\operatorname{eml}(L_2 + L_x, 1), 1) \cdot \operatorname{eml}(y,1)),1)\big),1\big)\Big)
      
      Gemini verwechselte EML mit „elementary mathematical layers“
  • Ich habe 36 verschiedene zweistufige EML-Funktionen einer einzelnen Variablen visualisiert
    Die ersten 18 liefern reelle Ausgaben, die übrigen enthalten unterwegs komplexe Werte
    Bildlink

    • Es wäre interessant, alle Binärbaumfunktionen mit fester Tiefe vollständig zu klassifizieren und die Bäume als Binärzahlen zu kodieren
      Alte Funktionentabellen aus Mathematikbüchern ließen sich dann vielleicht als einfacher Hash-Lookup neu interpretieren
  • Die Aussage „Mit EML und der Zahl 1 kann man jede Berechnung ausdrücken“ erinnert mich an den Iota-Kombinator
    Das ähnelt der Idee, mit einem minimalen formalen System Turing-Vollständigkeit zu erreichen

  • Der aktuelle Paper-Link ist noch v1 und ohne Abbildungen. Er sollte auf v2 geändert werden
    Ich lese noch, aber wenn das stimmt, könnte es eine große Entdeckung seit Jahren sein
    Wenn man Daten oder Wellenfunktionen statt mit Splines oder Polynomen mit EML-Bäumen fitten könnte,
    ließen sich auch mehrvariable Funktionen per gradient descent lernen und in EML-Approximationbäume umwandeln
    Man könnte sogar so trainieren, dass die Ableitungsbedingungen der Schrödinger-Gleichung erfüllt werden
    Es wirkt fast zu gut, um wahr zu sein, aber so etwas ist tatsächlich schon vorgekommen

    • Nach meiner Erfahrung aus einem Jahr Forschung in diesem Bereich ist EML mächtig, aber das Problem ist die Explosion der Ausdrucksgröße
      Schon um eine einzelne Multiplikation auszudrücken, braucht man einen Baum der Tiefe 8 und mehr als 41 Blätter
      Es gibt einen Trade-off zwischen der Eleganz einer minimalen Operationsmenge und der Länge des Ausdrucks
      Ich habe mit einem Ansatz gearbeitet, der Operadentheorie und Kategorientheorie nutzt, um spektrale neuronale Netze mit symbolic regression zu verbinden
    • Das ist derselbe Grund, aus dem man nicht die gesamte boolesche Logik nur mit NAND implementiert. Es geht um Recheneffizienz
      Polynome sind bei hoher Ausdruckskraft rechnerisch schnell
    • Das Paper ist interessant und elegant, aber keine wettbewerbsfähige Alternative für Regression oder Optimierung
      Das, was du beschreibst, ähnelt bestehender symbolic regression. Das ist bereits ein ausgereiftes Feld
    • Der EML-basierte Ansatz ist cool, aber selbst einfache Funktionen wie + sind nur schwer auszudrücken
      Trotzdem ist es eine sehr interessante Entdeckung
    • Ein netter Trick, aber als bahnbrechende Entdeckung wirkt das etwas übertrieben
  • Die Herleitung von -x scheint fehlerhaft zu sein
    Wenn man den Ausführungsablauf der Stack-Maschine verfolgt, ergibt sich eml(z, eml(x,1)) = e^z - x,
    und damit das zu -x wird, müsste e^z = 0 gelten. Aber ein solches komplexes z existiert nicht
    Wenn man z tatsächlich ausformuliert, landet man bei Problemen wie ln(0). Bei x^-1 ist es ähnlich
    Falls man Annahmen wie ln(0)=∞ und x/∞=0 zulässt, funktioniert es „halbwegs plausibel“

    • Der Autor erwähnt die RPN-Notation, liefert die Formeln aber nur als Bilder, was unpraktisch ist
      Verfolgt man die Rechenschritte, ergibt sich ln(1)=0 → e-ln(0)=+∞ → e-ln(+∞)=-∞
    • Das Paper erkennt dieses Problem selbst an. Ich habe zu schnell geurteilt
  • Mir kommen dazu einige interessante Ideen

    1. Wenn man den Betrag über sqrt(x*x) hinzunimmt, lassen sich auch min, max und signum herleiten
    2. Wenn f(x) und f⁻¹(x) bijektive Funktionen sind, die sich mit eml() ausdrücken lassen, könnte man mit eml(f(x), f(y)) und f⁻¹(1) eine weitere universelle Grundlage bauen
    3. Statt des natürlichen Logarithmus könnte eine Grundlage der Form 2^x - log₂(y) rechnerisch effizienter sein. Das erinnert an Elias omega coding
    4. Wenn es einen Algorithmus zur Ableitungsberechnung für eml()-Bäume gäbe, könnte man vielleicht klar beweisen, welche Funktionen kein symbolisches unbestimmtes Integral besitzen
    5. Die Erweiterung in den komplexen Bereich könnte auch mit komplexwertiger Fuzzy-Logik zusammenhängen. Vielleicht ließen sich Lukasiewicz- und multiplikative Logik vereinheitlichen
  • Aus Spaß habe ich gestern das Projekt emlvm gebaut

  • Die Stelle „Mit EML-Bäumen der Tiefe 4 oder weniger ist eine Wiederherstellung geschlossener Formen möglich“ ist wirklich großartig
    Ich habe mich immer gefragt, ob so etwas machbar ist