LG AI Research veröffentlicht EXAONE Deep

lemonmint · 2025-03-19T10:45:38+09:00

Neues Reasoning-AI-Modell EXAONE Deep von LG AI Research vorgestellt Ein leistungsstarkes Schlussfolgerungsmodell, das für den Übergang in das Zeitalter der Agentic AI unverzichtbar ist Herausragende Schlussfolgerungsfähigkeiten in den Bereichen Mathematik, Wissenschaft und Coding nachgewiesen Hauptmerkmale: Mathematik: Überlegene Leistung gegenüber Konkurrenzmodellen in anspruchsvollen Mathematik-Benchmarks (gleichwertige Leistung mit kleinerer Modellgröße erreicht) Wissenschaft & Coding: Platz 1 in wichtigen Benchmarks (Modelle 7.8B und 2.4B) MMLU: Beste Leistung unter inländischen Modellen erzielt (32B-Modell) In Epoch AIs Liste bemerkenswerter AI-Modelle aufgenommen und damit leistungstechnisch validiert (nach EXAONE 3.5 das zweite Exaone-Modell) Herausragende Leistung im Bereich Mathematik Alle EXAONE-Deep-Modelle (32B, 7.8B, 2.4B) erzielten die Höchstpunktzahl im Mathematikteil des College Scholastic Ability Test 2025 EXAONE Deep 32B: CSAT Mathematik 94.5 Punkte, AIME 2024 90.0 Punkte Auf dem Niveau des Modells DeepSeek-R1 (671B) bei AIME 2025 Zeigte insbesondere im anspruchsvollen Benchmark AIME eine starke Leistung und belegte damit Trainings- und Kosteneffizienz EXAONE Deep 7.8B & 2.4B: In ihren jeweiligen Kategorien für leichtgewichtige und On-Device-Modelle Platz 1 in wichtigen Benchmarks Modell 7.8B: MATH-500 94.8 Punkte, AIME 2025 59.6 Punkte Modell 2.4B: MATH-500 92.3 Punkte, AIME 2024 47.9 Punkte Wichtige Mathematik-Benchmarks: CSAT (College Scholastic Ability Test) AIME (American Invitational Mathematics Examination) MATH-500 Hervorragende Fachkompetenz in Wissenschaft und Coding Auch in Wissenschaft und Coding wurde eine überlegene Leistung gegenüber Konkurrenzmodellen nachgewiesen EXAONE Deep 32B: 66.1 Punkte im GPQA Diamond Test (Bewertung der Fähigkeit, wissenschaftliche Probleme auf PhD-Niveau zu lösen) 59.5 Punkte auf LiveCodeBench (Bewertung der Coding-Fähigkeit), übertrifft Reasoning-AI-Modelle ähnlicher Größe Deutet auf hohe Einsatzmöglichkeiten auch in Bereichen hin, die Fachwissen erfordern EXAONE Deep 7.8B & 2.4B: Platz 1 bei GPQA Diamond und LiveCodeBench Etabliert sich nach dem EXAONE-3.5-2.4B-Modell als global führendes Modell im Bereich leichtgewichtiger/On-Device-Modelle Wichtige Benchmarks für Wissenschaft und Coding: GPQA Diamond LiveCodeBench

(lgresearch.ai)

24 Punkte von lemonmint 2025-03-19 | 9 Kommentare | Auf WhatsApp teilen

Neues Reasoning-AI-Modell EXAONE Deep von LG AI Research vorgestellt
Ein leistungsstarkes Schlussfolgerungsmodell, das für den Übergang in das Zeitalter der Agentic AI unverzichtbar ist
Herausragende Schlussfolgerungsfähigkeiten in den Bereichen Mathematik, Wissenschaft und Coding nachgewiesen
Hauptmerkmale:
- Mathematik: Überlegene Leistung gegenüber Konkurrenzmodellen in anspruchsvollen Mathematik-Benchmarks (gleichwertige Leistung mit kleinerer Modellgröße erreicht)
- Wissenschaft & Coding: Platz 1 in wichtigen Benchmarks (Modelle 7.8B und 2.4B)
- MMLU: Beste Leistung unter inländischen Modellen erzielt (32B-Modell)
In Epoch AIs Liste bemerkenswerter AI-Modelle aufgenommen und damit leistungstechnisch validiert (nach EXAONE 3.5 das zweite Exaone-Modell)

Herausragende Leistung im Bereich Mathematik

Alle EXAONE-Deep-Modelle (32B, 7.8B, 2.4B) erzielten die Höchstpunktzahl im Mathematikteil des College Scholastic Ability Test 2025
EXAONE Deep 32B:
- CSAT Mathematik 94.5 Punkte, AIME 2024 90.0 Punkte
- Auf dem Niveau des Modells DeepSeek-R1 (671B) bei AIME 2025
- Zeigte insbesondere im anspruchsvollen Benchmark AIME eine starke Leistung und belegte damit Trainings- und Kosteneffizienz
EXAONE Deep 7.8B & 2.4B:
- In ihren jeweiligen Kategorien für leichtgewichtige und On-Device-Modelle Platz 1 in wichtigen Benchmarks
- Modell 7.8B: MATH-500 94.8 Punkte, AIME 2025 59.6 Punkte
- Modell 2.4B: MATH-500 92.3 Punkte, AIME 2024 47.9 Punkte
Wichtige Mathematik-Benchmarks:
- CSAT (College Scholastic Ability Test)
- AIME (American Invitational Mathematics Examination)
- MATH-500

Hervorragende Fachkompetenz in Wissenschaft und Coding

Auch in Wissenschaft und Coding wurde eine überlegene Leistung gegenüber Konkurrenzmodellen nachgewiesen
EXAONE Deep 32B:
- 66.1 Punkte im GPQA Diamond Test (Bewertung der Fähigkeit, wissenschaftliche Probleme auf PhD-Niveau zu lösen)
- 59.5 Punkte auf LiveCodeBench (Bewertung der Coding-Fähigkeit), übertrifft Reasoning-AI-Modelle ähnlicher Größe
- Deutet auf hohe Einsatzmöglichkeiten auch in Bereichen hin, die Fachwissen erfordern
EXAONE Deep 7.8B & 2.4B:
- Platz 1 bei GPQA Diamond und LiveCodeBench
- Etabliert sich nach dem EXAONE-3.5-2.4B-Modell als global führendes Modell im Bereich leichtgewichtiger/On-Device-Modelle
Wichtige Benchmarks für Wissenschaft und Coding:
- GPQA Diamond
- LiveCodeBench

9 Kommentare

sice81 2025-03-20

Wow, ich unterstütze LG. Ist das LLM nicht fast das Beste, was wir in unserem Land haben? Soweit ich gehört habe, wird es auch intern sehr gut genutzt ... Schade ist allerdings die Lizenz. Es wäre schön, wenn bei Erscheinen einer neuen Version die alte Version unter MIT freigegeben würde.

mindok 2025-03-19

EXAONE 3.5 war schon ganz ordentlich, um es lokal auf einem Notebook laufen zu lassen, daher bin ich gespannt.

bungker 2025-03-19

Ich war wirklich überrascht. Ich dachte, das wäre nur PR-Gerede, aber dass das konservative LG so etwas herausbringt und sogar öffentlich macht …

halfenif 2025-03-20

Bei der Lizenz, die ich mir angesehen habe, frage ich mich schon, wie sie sich nutzen lässt.

Beschränkungen
3.1 Kommerzielle Nutzung: Dem Lizenznehmer ist es ausdrücklich untersagt, das Modell, Derivate oder Ausgaben
für kommerzielle Zwecke zu verwenden, einschließlich, aber nicht beschränkt auf die Entwicklung oder Bereitstellung von Produkten, Dienstleistungen oder
Anwendungen, die direkt oder indirekt Umsatz generieren.

3.1 Kommerzielle Nutzung: Dem Lizenznehmer ist es ausdrücklich untersagt, das Modell, Derivate oder Ausgaben für kommerzielle Zwecke zu verwenden, einschließlich der Entwicklung oder Bereitstellung von Produkten, Dienstleistungen oder Anwendungen, die direkt oder indirekt Umsatz generieren.

Eigentum
4.2 Ausgaben: Alle Rechte, Ansprüche und Interessen an den vom Modell und seinen Derivaten erzeugten Ausgaben
in ihrer ursprünglichen oder geänderten Form sind und bleiben das ausschließliche Eigentum des Lizenzgebers.

4.2 Ausgaben: Alle Rechte, Ansprüche und Interessen an den vom Modell und seinen Derivaten erzeugten Ausgaben sind unabhängig davon, ob sie in ursprünglicher oder geänderter Form vorliegen, das ausschließliche Eigentum des Lizenzgebers und bleiben dies auch.

yosemite 2025-03-20

Ja. Es ist eine Lizenz, die keine kommerzielle Nutzung erlaubt. Deshalb kommt es für mich nicht infrage.

junia3 2025-03-19

Ich habe es installiert und auf dem Server ausprobiert, aber im Vergleich zu qwq ist die think-Zeit viel zu lang.
Ob es die richtigen Antworten gut trifft, weiß ich zwar nicht, aber die Latenz wirkt heftiger als gedacht.

junia3 2025-03-19

Das betraf offenbar nur einige Probleme. Nachdem ich noch ein paar weitere Durchläufe zum Vergleich gemacht habe, scheinen die Ergebnisse ähnlich auszufallen.

nowdoit7 2025-03-19

Ich drücke die Daumen~ LG~ viel Erfolg~

jujumilk3 2025-03-19

Viel Erfolg. Ich drücke überall, wo ich es auf LinkedIn sehe, auf „Gefällt mir“.

LG AI Research veröffentlicht EXAONE Deep

Herausragende Leistung im Bereich Mathematik

Hervorragende Fachkompetenz in Wissenschaft und Coding

Verwandte Beiträge

9 Kommentare