13 Punkte von xguru 2024-08-07 | 2 Kommentare | Auf WhatsApp teilen
  • EXAONE 3.0 wurde im August 2024 vorgestellt, zunächst nur intern bei LG genutzt und nun in ein offenes Modell überführt
  • Aus der für verschiedene Einsatzzwecke zusammengestellten Modellreihe wird das 7.8B Instruction-Tuned-Modell für Forschungszwecke als Open Source veröffentlicht
  • Man hofft, damit zu bedeutender Forschung von KI-Forschenden im In- und Ausland sowie zur Weiterentwicklung des KI-Ökosystems beizutragen
  • Basierend auf einer Decoder-only-Transformer-Architektur, mit 7.8B Parametern und 8T Trainingsdaten

Erreicht englische Leistung auf globalem Spitzenniveau: Platz 1 beim Durchschnittswert für Real-world Use Cases, starke Performance auch in Einzel-Benchmarks

  • Die englische Leistung des 7.8B-Modells liegt im Vergleich zu anderen Modellen auf globalem Spitzenniveau
  • Die Auswertung über vier Benchmarks bestätigt eine bessere Leistung als globale Top-Modelle
  • Platz 1 beim Durchschnittswert in Mathematik und Coding, zudem hohe Leistung beim Reasoning

Deutlich überlegene koreanische Leistung: Platz 1 beim Durchschnittswert sowohl für Real-world Use Cases als auch in Einzel-Benchmarks

  • Als englisch-koreanisches bilinguales Modell liefert es auch auf Koreanisch hervorragende Leistung
  • Zur Überprüfung der Leistung bei Real-world Use Cases wurden zwei Benchmarks verwendet
  • Die Einzel-Benchmarks wurden so aufgebaut, dass sie mit englischen Evaluierungs-Benchmarks wie KMMLU übereinstimmen
  • Sowohl bei Real-world Use Cases als auch in Einzel-Benchmarks wurde Platz 1 beim Durchschnittswert erreicht

Verbesserte Wirtschaftlichkeit: Kosten nach drei Jahren Forschung und Entwicklung auf 6 % gesenkt

  • Für den praktischen Einsatz von KI ist neben besserer Leistung auch eine höhere Wirtschaftlichkeit unerlässlich
  • Über drei Jahre hinweg wurde die Forschung und Entwicklung auf Techniken zur Modellkomprimierung und Kostenoptimierung konzentriert
  • Beim 7.8B-Modell wurden gegenüber EXAONE 2.0 die Inferenzzeit um 56 % und die Kosten um 72 % reduziert
  • Im Vergleich zu EXAONE 1.0 konnten die Kosten deutlich auf 6 % gesenkt werden

Ethische Transparenz: Neben guten Ergebnissen werden auch Bereiche mit Verbesserungsbedarf offengelegt

  • LG AI Research berücksichtigt KI-Ethik konsequent im gesamten Forschungs- und Entwicklungsprozess von KI-Modellen
  • Auch das EXAONE 3.0 7.8B-Modell wurde durch Red Teaming auf Ethik und Sicherheit geprüft
  • Für die Bewertung wurden interne sowie externe Datensätze von Drittanbietern verwendet
  • Beim Verhindern geschlechtsbezogener Diskriminierung und illegaler Antworten zeigt das Modell gute Ergebnisse, es gibt jedoch weiterhin Bereiche mit Verbesserungsbedarf
  • Zur Förderung der KI-Ethik werden die Evaluationsergebnisse transparent veröffentlicht
  • Es wird auf aktive Forschung zur KI-Ethik durch Forschende gehofft, LG AI Research will die Forschung ebenfalls fortsetzen

2 Kommentare

 
[Dieser Kommentar wurde ausgeblendet.]
 
xguru 2024-08-07

Ich hoffe, dass hier künftig auch häufiger inländische Nachrichten geteilt werden ;)