- Neues Reasoning-AI-Modell EXAONE Deep von LG AI Research vorgestellt
- Ein leistungsstarkes Schlussfolgerungsmodell, das für den Übergang in das Zeitalter der Agentic AI unverzichtbar ist
- Herausragende Schlussfolgerungsfähigkeiten in den Bereichen Mathematik, Wissenschaft und Coding nachgewiesen
- Hauptmerkmale:
- Mathematik: Überlegene Leistung gegenüber Konkurrenzmodellen in anspruchsvollen Mathematik-Benchmarks (gleichwertige Leistung mit kleinerer Modellgröße erreicht)
- Wissenschaft & Coding: Platz 1 in wichtigen Benchmarks (Modelle 7.8B und 2.4B)
- MMLU: Beste Leistung unter inländischen Modellen erzielt (32B-Modell)
- In Epoch AIs Liste bemerkenswerter AI-Modelle aufgenommen und damit leistungstechnisch validiert (nach EXAONE 3.5 das zweite Exaone-Modell)
Herausragende Leistung im Bereich Mathematik
- Alle EXAONE-Deep-Modelle (32B, 7.8B, 2.4B) erzielten die Höchstpunktzahl im Mathematikteil des College Scholastic Ability Test 2025
- EXAONE Deep 32B:
- CSAT Mathematik 94.5 Punkte, AIME 2024 90.0 Punkte
- Auf dem Niveau des Modells DeepSeek-R1 (671B) bei AIME 2025
- Zeigte insbesondere im anspruchsvollen Benchmark AIME eine starke Leistung und belegte damit Trainings- und Kosteneffizienz
- EXAONE Deep 7.8B & 2.4B:
- In ihren jeweiligen Kategorien für leichtgewichtige und On-Device-Modelle Platz 1 in wichtigen Benchmarks
- Modell 7.8B: MATH-500 94.8 Punkte, AIME 2025 59.6 Punkte
- Modell 2.4B: MATH-500 92.3 Punkte, AIME 2024 47.9 Punkte
- Wichtige Mathematik-Benchmarks:
- CSAT (College Scholastic Ability Test)
- AIME (American Invitational Mathematics Examination)
- MATH-500
Hervorragende Fachkompetenz in Wissenschaft und Coding
- Auch in Wissenschaft und Coding wurde eine überlegene Leistung gegenüber Konkurrenzmodellen nachgewiesen
- EXAONE Deep 32B:
- 66.1 Punkte im GPQA Diamond Test (Bewertung der Fähigkeit, wissenschaftliche Probleme auf PhD-Niveau zu lösen)
- 59.5 Punkte auf LiveCodeBench (Bewertung der Coding-Fähigkeit), übertrifft Reasoning-AI-Modelle ähnlicher Größe
- Deutet auf hohe Einsatzmöglichkeiten auch in Bereichen hin, die Fachwissen erfordern
- EXAONE Deep 7.8B & 2.4B:
- Platz 1 bei GPQA Diamond und LiveCodeBench
- Etabliert sich nach dem EXAONE-3.5-2.4B-Modell als global führendes Modell im Bereich leichtgewichtiger/On-Device-Modelle
- Wichtige Benchmarks für Wissenschaft und Coding:
- GPQA Diamond
- LiveCodeBench
9 Kommentare
Wow, ich unterstütze LG. Ist das LLM nicht fast das Beste, was wir in unserem Land haben? Soweit ich gehört habe, wird es auch intern sehr gut genutzt ... Schade ist allerdings die Lizenz. Es wäre schön, wenn bei Erscheinen einer neuen Version die alte Version unter MIT freigegeben würde.
EXAONE 3.5 war schon ganz ordentlich, um es lokal auf einem Notebook laufen zu lassen, daher bin ich gespannt.
Ich war wirklich überrascht. Ich dachte, das wäre nur PR-Gerede, aber dass das konservative LG so etwas herausbringt und sogar öffentlich macht …
Bei der Lizenz, die ich mir angesehen habe, frage ich mich schon, wie sie sich nutzen lässt.
3.1 Kommerzielle Nutzung: Dem Lizenznehmer ist es ausdrücklich untersagt, das Modell, Derivate oder Ausgaben
für kommerzielle Zwecke zu verwenden, einschließlich, aber nicht beschränkt auf die Entwicklung oder Bereitstellung von Produkten, Dienstleistungen oder
Anwendungen, die direkt oder indirekt Umsatz generieren.
3.1 Kommerzielle Nutzung: Dem Lizenznehmer ist es ausdrücklich untersagt, das Modell, Derivate oder Ausgaben für kommerzielle Zwecke zu verwenden, einschließlich der Entwicklung oder Bereitstellung von Produkten, Dienstleistungen oder Anwendungen, die direkt oder indirekt Umsatz generieren.
4.2 Ausgaben: Alle Rechte, Ansprüche und Interessen an den vom Modell und seinen Derivaten erzeugten Ausgaben
in ihrer ursprünglichen oder geänderten Form sind und bleiben das ausschließliche Eigentum des Lizenzgebers.
4.2 Ausgaben: Alle Rechte, Ansprüche und Interessen an den vom Modell und seinen Derivaten erzeugten Ausgaben sind unabhängig davon, ob sie in ursprünglicher oder geänderter Form vorliegen, das ausschließliche Eigentum des Lizenzgebers und bleiben dies auch.
Ja. Es ist eine Lizenz, die keine kommerzielle Nutzung erlaubt. Deshalb kommt es für mich nicht infrage.
Ich habe es installiert und auf dem Server ausprobiert, aber im Vergleich zu qwq ist die
think-Zeit viel zu lang.Ob es die richtigen Antworten gut trifft, weiß ich zwar nicht, aber die Latenz wirkt heftiger als gedacht.
Das betraf offenbar nur einige Probleme. Nachdem ich noch ein paar weitere Durchläufe zum Vergleich gemacht habe, scheinen die Ergebnisse ähnlich auszufallen.
Ich drücke die Daumen~ LG~ viel Erfolg~
Viel Erfolg. Ich drücke überall, wo ich es auf LinkedIn sehe, auf „Gefällt mir“.