19 Punkte von cjb9452 2026-03-28 | 8 Kommentare | Auf WhatsApp teilen

Hallo, ich bin ein studentischer Entwickler, der mit einem Toy-Projekt zur Verwaltung meines persönlichen Portfolios angefangen hat und dessen Vorhaben mit der Zeit immer größer wurde, bis ich schließlich ein System mit 31 LLM-Agenten aufgebaut habe.

Anfangs war es als B2C-Webservice zur Aktienempfehlung geplant, um Nutzer zu gewinnen. Dabei bin ich jedoch auf die Probleme enormer API-Kommunikationskosten und der schwer nachweisbaren Nützlichkeit gestoßen. Deshalb habe ich die Nutzergewinnung (Marketing) aufgegeben, die gesamte UI/UX entfernt und auf eine Pipeline umgestellt, in der meine echte Brokerage-Kontoanbindung (10 Millionen Won) direkt verbunden ist und die AI alle Entscheidungen und Trades eigenständig ausführt. So betreibe ich das System derzeit.

Ich möchte die Architektur, die ich mir in dieser Zeit erarbeitet habe, und die technischen Irrwege und Erfahrungen mit der GeekNews-Community teilen.


🧠 Systemarchitektur: 6 Phasen, Kreuzvalidierung durch 31 Agenten

Dieses System (K-Agent Alpha) arbeitet nicht mit einem einzelnen Prompt, sondern als Multi-Agent-Relay-Pipeline, die einen vollständigen Top-Down-Investmentansatz nachbildet. Es läuft über etwa eine Stunde hinweg sequentiell ab.

  1. Portfolio- & Psychologieanalyse (Phase 0~1):

    • Über die KIS-(Korea Investment & Securities)-API werden die tatsächlichen Bestände geladen und die Trefferquote früherer Trades analysiert, um die Feedback-Schleife zu unterstützen.
    • Auf Basis von fünf Indikatoren wie Volatilität (VIX), Wechselkurs und KOSPI-Bewegung wird die Marktpositionierung festgelegt.
  2. Makroökonomie-Team (Phase 2 - 7 Agenten):

    • Agenten für Zinsen, Wechselkurse und Derivate analysieren über FRED, die API der Bank of Korea usw. die globale Liquidität.
    • Um einseitiges Denken zu verhindern, wurde das System so entworfen, dass es zwingend drei Szenarien ableitet: Base/Bull/Bear.
  3. Industrie-/Sektor-Team (Phase 3 - 10 Agenten):

    • Dies ist die ausgefeilteste Pipeline im System. Auf Basis von Echtzeit-Kapitalzuflüssen aus dem Ausland und von Institutionellen, Branchen-PERs und News aus der Suche werden vielversprechende Sektoren gescreent.
    • Um für LLMs typische Halluzinationen (Empfehlung nicht existierender Aktien) zu verhindern, wurde ein Validator-Agent eingesetzt, der Delistings oder eine zu geringe Marktkapitalisierung mechanisch herausfiltert.
  4. Unternehmensanalyse- und Risiko-Team (Phase 4 - 8 Agenten):

    • DART-Finanzberichte, Charts (technische Indikatoren) und News werden analysiert, um Kandidaten auszuwählen. Ein Risk Manager prüft Short-Selling-Druck und MDD.
  5. Finale Entscheidungsinstanz CIO (Phase 5 - 1 Agent):

    • Die Ergebnisse von 30 Modellen (Gemini Flash) werden vom leistungsstärksten Spitzenmodell gemini-3.1-pro-preview konsolidiert.
    • Um Fehler wie die Sunk Cost Fallacy zu vermeiden, wird per Prompt für „Bounded Autonomy“ zwingend verlangt, „das Bear-Case-Szenario für den Fall, dass ich falsch liege“ sowie „Bedingungen zur Invalidierung des Investments“ anzugeben. Das dabei erzeugte JSON wird an meine API von Korea Investment & Securities gesendet.

💡 Troubleshooting: kognitive Verzerrungen von LLMs und Traffic-Spitzen

Beim Betrieb des Systems gab es zwei schmerzhafte Probleme, die ich lösen musste.

  1. LLMs können keine Verluste begrenzen (Dispositionseffekt):
    • Die AI reproduzierte exakt dieselben kognitiven Verzerrungen wie Menschen: Gewinnpositionen wollte sie schon bei kleinen Anstiegen verkaufen, während sie verlustreiche Aktien mit dem Gedanken „die steigen irgendwann wieder“ liegen ließ. Um das zu verhindern, habe ich die Logik so geändert, dass bei widersprüchlichen Entscheidungen zwischen gestern und heute offengelegt werden muss, warum sich die Position geändert hat, und dass das System seine eigene frühere Trefferquote bewertet und sich selbst per Gegenprüfung (Red-Teaming) widerspricht.
  2. API-Traffic-Grenzen von 31 Agenten (Rate Limit & Context Limits):
    • Bei der tiefgehenden Analyse von 20 bis 30 Aktien kam es immer wieder zu Token-Überläufen oder blockierenden Limits externer APIs. Deshalb habe ich große Datenmengen wie Finanzkennzahlen und Chart-Indikatoren auf eine Batch-Verarbeitungsarchitektur umgestellt, bei der sie backendseitig in einem Schritt mit Funktionen wie get_fundamental_batch_all zusammengefasst und eingespeist werden. So konnte die Laufzeit stabil auf unter eine Stunde gebracht werden.

📊 Beispiel für Logs, die die AI tatsächlich ausgibt

Nach Abschluss dieses Prozesses gibt die AI einen ziemlich tiefgehenden strategischen Bericht (Log) wie den folgenden aus.

(Auszug aus einem realen makroökonomischen Diagnose-Log, das die AI gestern erstellt hat)
"Da die Erholung des PPI (Erzeugerpreisindex) mit 2,43 % den CPI (2,0 %) überholt hat, wird eine Margin Squeeze bei Unternehmen Realität ...
Der Futures-Markt verzeichnet einen tiefen Backwardation-Zustand von -1112.61.
Der Eintritt in eine 'Sudden Stop'-Phase wird immer greifbarer, da der Ölpreis die Marke von 100 Dollar überschreitet und der Wechselkurs über 1.520 Won steigt.
Barquote deutlich auf rund 34 % erhöhen. Aufnahme von Schiffbau-Zulieferern, die branchenübergreifend besonders attraktiv unterbewertet erscheinen."


💻 Ausführungsergebnisse ansehen und Logs verfolgen

Da der komplette Quellcode noch mit meinen Sicherheitsschlüsseln und der Logik für das echte Konto verflochten ist, kann ich ihn derzeit nicht als Open Source so veröffentlichen, dass man ihn direkt per git clone ausführen könnte (ich plane aber, die Kern-Prompts und die Pipeline später aufzubereiten und auf GitHub zu stellen).

Stattdessen habe ich einen speziellen Telegram-Kanal angebunden, damit ihr beurteilen könnt, welche Entscheidungs-Logs (Ergebnisse) diese Pipeline aus 31 Prompts tatsächlich produziert, wenn sie jeden Tag eine Stunde lang diskutiert.

  • Es geht weder um eine Landingpage noch um das Sammeln von E-Mails oder Marketingzwecke.
  • Täglich um 15:05 Uhr werden institutionelle Investment-Reports, die ohne menschliches Eingreifen zu 100 % automatisch von LLMs erzeugt werden, sowie die daraus resultierenden Echtzeit-Trades (an ein echtes Konto angebunden) als Stream veröffentlicht.

👉 Kanal mit Echtzeit-Logs der AI-Entscheidungen (Reports): t.me/K_Agent_Alpha

Falls sich hier Leute für Multi-Agent-Systeme oder Prompt Engineering interessieren, würde ich mich sehr über schonungslose Ratschläge oder technisches Feedback zur Architektur oder zur Korrektur von Fehlern in den AI-Entscheidungen freuen!

8 Kommentare

 
github88 2026-03-29

Ach je..

 
dydwls140 2026-03-30

Ach du lieber Himmel...

 
woonsa 2026-03-30

LLMs haben Inferenzzeit, daher reagieren sie für Echtzeithandel oder Hochfrequenzhandel wie HFT zu langsam. Praktisch ist das nur auf Basis von mindestens 5-Minuten-Kerzen möglich. Außerdem wird die Leistungsfähigkeit nicht automatisch besser, nur weil man mehrere LLM-Modelle miteinander verknüpft. Sinnvoller wäre es, etwa 5 LLMs für Dinge wie Logik oder emotionale Analysen einzusetzen – also dafür, ob Markt oder Community gerade Euphorie, Unsicherheit oder Angst zeigen, was LSTM-Modelle nicht erfassen können. Diese sollte man dann mit Deep-Learning-Modellen wie Advanced PPO, CNN, LSTM (Analyse historischer Chartdaten) sowie einer auf der eigenen Analyselogik basierenden Handelsmethode zu einem Ensemble verbinden. Für ultrakurzfristigen Handel sind Deep-Learning-Modelle wie LSTM und CNN besser geeignet.

 
cjb9452 2026-03-30

Diesen Punkt berücksichtigen wir ausreichend. Deshalb versuchen wir, durch Wetten auf den Schlusskurs zum Handelsschluss Hochfrequenzhandel zu vermeiden.

 
woonsa 2026-03-31

Noch ein kleiner Tipp: Kleine LLM-Modelle per SFT-(NTR)-Tuning auf eine bestimmte Domäne zu spezialisieren und diese lokal laufen zu lassen, während man für die API nur ein einziges großes Sprachmodell nutzt, ist sinnvoll! Wenn man Modelle in der Größenordnung von 7B oder 3B für bestimmte Analysen spezialisiert, erzielt man etwas bessere Ergebnisse. Ach ja: Wenn ihr für SFT (NTR) aktiv AI Hub nutzt, ist es einfacher, Datensätze zu erstellen. (Ich habe selbst schon einmal etwas Ähnliches gebaut ^^;)

 
woonsa 2026-03-30

Ach ja, unbedingt ein bis zwei Monate Backtesting einplanen. Sonst kann es passieren, dass das LLM Unsinn macht und man zusehen muss, wie Vermögen verloren geht. (Kauf am Tiefpunkt, Verkauf am Höchststand)

 
galaxy11111 2026-03-30

Da haben Sie wohl einen äußerst ausgeklügelten Haufen Halluzinationen gebaut … Der Markt ist nicht vorhersagbar. Wenn sich das Vermögen mit dem, was Sie gebaut haben, mehr als verdoppelt, werde ich einräumen, dass ich falschlag.

 
cjb9452 2026-03-30

Es könnte eine Halluzination sein. Deshalb werde ich es auch beobachten. Da ich mein eigenes Geld investiert habe, werde ich fortlaufend Updates geben müssen. Es ist eine Art Experiment.