Auf Analyse von Nachrichten zum koreanischen Aktienmarkt und Investment-Research spezialisierter Agenten-LLM mit 7B Parametern
(huggingface.co)Wir stellen VELA vor, ein auf den koreanischen Aktienmarkt (KOSPI+KOSDAQ) spezialisiertes Sprachmodell.
Es wurde auf Basis von Qwen2.5-7B-Instruct mit einer SFT- + DPO-Pipeline feinabgestimmt.
Warum wir es entwickelt haben
Bestehende Finanz-LLMs halluzinieren bei Begriffen aus dem koreanischen Markt oft stark,
oder es tritt das Problem eines Language Leaks auf, bei dem Antworten mitten im Text auf Chinesisch/Englisch wechseln.
VELA wurde mit DPO gezielt auf diese beiden Probleme hin korrigiert.
Trainingsdaten
- SFT: 36.713 Samples / 2.135 Aktienwerte (Nachrichtenklassifizierung, Signale für starke Kursanstiege/-rückgänge, Broker-Reports, Tool-Calling, Sektor-/Makroanalyse usw.)
- DPO: 24.779 Paare (Entfernung von chinesischen/englischen Leaks, Ausrichtung auf das Format der Reasoning Trace)
Ausgabeformat
- Reasoning Trace – schrittweiser Denkprozess im JSON-Format (
search→analyze→confidence) - Synthesis Report – Research-Report mit 7 Abschnitten (Zusammenfassung, Kennzahlen, Kapitalflüsse, Nachrichteneinfluss, Risiken, Investmentmeinung)
Leistung (basierend auf RTX 3060 12GB)
| Format | Geschwindigkeit | Größe | Chinese Leak |
|---|---|---|---|
| Q4_K_M | 36 tok/s | 4.4GB | 0/5 CLEAN |
| Q8_0 | 25 tok/s | 7.6GB | 0/5 CLEAN |
Hinweis: Für den praktischen Einsatz müssen Sie dem Modell ordentliche Nachrichtenquellen und Daten bereitstellen. Ohne verlässliche Quellen können Halluzinationen auftreten. Es ist für die Verwendung zusammen mit https://github.com/unohee/vela-framework konzipiert.
Unterstützte Schnittstellen
llama-cpp-python / Ollama / vLLM / Transformers / MLX
Lizenz: Apache 2.0
🤗 https://huggingface.co/intrect/VELA
Echtzeitkurse werden über eine externe API bereitgestellt, und VELA ist als darauf aufbauende Inferenzschicht konzipiert.
Es dient der Informationsbereitstellung und ist keine Anlageberatung.
3 Kommentare
Das ist wirklich großartig ^^
Klingt großartig! Ist es auch mit 7B stabil?
Gemessen an der Modellgröße sind die grundlegenden Aufgaben klar besser als beim Basismodell. Ich sollte wohl auch die Benchmarks mit hochladen!