8 Punkte von unohee 2026-03-31 | 3 Kommentare | Auf WhatsApp teilen

Wir stellen VELA vor, ein auf den koreanischen Aktienmarkt (KOSPI+KOSDAQ) spezialisiertes Sprachmodell.

Es wurde auf Basis von Qwen2.5-7B-Instruct mit einer SFT- + DPO-Pipeline feinabgestimmt.

Warum wir es entwickelt haben
Bestehende Finanz-LLMs halluzinieren bei Begriffen aus dem koreanischen Markt oft stark,
oder es tritt das Problem eines Language Leaks auf, bei dem Antworten mitten im Text auf Chinesisch/Englisch wechseln.
VELA wurde mit DPO gezielt auf diese beiden Probleme hin korrigiert.

Trainingsdaten

  • SFT: 36.713 Samples / 2.135 Aktienwerte (Nachrichtenklassifizierung, Signale für starke Kursanstiege/-rückgänge, Broker-Reports, Tool-Calling, Sektor-/Makroanalyse usw.)
  • DPO: 24.779 Paare (Entfernung von chinesischen/englischen Leaks, Ausrichtung auf das Format der Reasoning Trace)

Ausgabeformat

  1. Reasoning Trace – schrittweiser Denkprozess im JSON-Format (searchanalyzeconfidence)
  2. Synthesis Report – Research-Report mit 7 Abschnitten (Zusammenfassung, Kennzahlen, Kapitalflüsse, Nachrichteneinfluss, Risiken, Investmentmeinung)

Leistung (basierend auf RTX 3060 12GB)

Format Geschwindigkeit Größe Chinese Leak
Q4_K_M 36 tok/s 4.4GB 0/5 CLEAN
Q8_0 25 tok/s 7.6GB 0/5 CLEAN

Hinweis: Für den praktischen Einsatz müssen Sie dem Modell ordentliche Nachrichtenquellen und Daten bereitstellen. Ohne verlässliche Quellen können Halluzinationen auftreten. Es ist für die Verwendung zusammen mit https://github.com/unohee/vela-framework konzipiert.

Unterstützte Schnittstellen
llama-cpp-python / Ollama / vLLM / Transformers / MLX

Lizenz: Apache 2.0

🤗 https://huggingface.co/intrect/VELA

Echtzeitkurse werden über eine externe API bereitgestellt, und VELA ist als darauf aufbauende Inferenzschicht konzipiert.
Es dient der Informationsbereitstellung und ist keine Anlageberatung.

3 Kommentare

 
310writer 2026-04-06

Das ist wirklich großartig ^^

 
ahiou 2026-04-01

Klingt großartig! Ist es auch mit 7B stabil?

 
unohee 2026-04-01

Gemessen an der Modellgröße sind die grundlegenden Aufgaben klar besser als beim Basismodell. Ich sollte wohl auch die Benchmarks mit hochladen!