7 Punkte von kangbit 2026-03-25 | 8 Kommentare | Auf WhatsApp teilen

Hallo! Ich habe den Service „Trump-Saith“ entwickelt, der in Echtzeit analysiert, wie sich die Aussagen des ehemaligen Präsidenten Trump auf die koreanische Wirtschaft und die Märkte auswirken.

Website: https://trump-saith.com/ (https://trump-saith.com/)
Hauptfunktionen: Echtzeit-Erfassung von Trumps Aussagen -> Koreanische Zusammenfassung per LLM -> Analyse der wirtschaftlichen Auswirkungen -> Bereitstellung eines Feeds nach Duplikatentfernung


💡 Warum habe ich das gebaut?

In letzter Zeit kommt es immer häufiger vor, dass schon eine einzige Aussage von Trump die heimischen Aktienmärkte und Wechselkurse stark schwanken lässt. Die Originaltexte auf Truth Social und anderen Plattformen sind jedoch schwer laufend zu verfolgen, und klassische Nachrichten sind durch redaktionelle Aufbereitung oft langsamer.
Deshalb habe ich dieses Projekt mit der Idee gestartet, „die Aussagen direkt so schnell wie möglich zu sammeln und die Kernpunkte aus Sicht von Entwicklern und Investoren kompakt zusammenzufassen“.

🛠️ Tech-Stack und Architektur

Da dies eine Entwickler-Community ist, möchte ich auch die Implementierung teilen. Ich habe die Pipeline in vier unabhängige Layer aufgebaut.

  • Data Collection (Python, APScheduler)
    Die Truth-Social-API und RSS-Kanäle werden im Minutentakt überwacht, um Rohdaten zu sammeln.
    Die erfassten Daten werden dauerhaft in Oracle DB gespeichert und über Redis Streams asynchron an den nächsten Layer weitergegeben.

  • Analysis (Gemini 2.0 Flash)
    Die gesammelten Originaltexte werden mit dem Modell Gemini 2.0 Flash analysiert.
    Dabei geht es nicht um eine einfache Übersetzung, sondern um die Extraktion von Zusammenfassungen und Keywords aus der Perspektive „Auswirkungen auf die koreanische Wirtschaft bzw. die Märkte“. (Zusammenfassung in 3–5 Sätzen)

  • Deduplication (Sentence-Transformers, Qdrant)
    Hier werden inhaltsgleiche Aussagen verarbeitet, die aus mehreren Kanälen gesammelt wurden.
    Mit dem Modell all-MiniLM-L6-v2 werden Satz-Embeddings erzeugt, und in Qdrant (Vector DB) werden Duplikate anhand einer Kosinus-Ähnlichkeit von 0,85 herausgefiltert.

  • API & Feed
    Abschließend werden die bereinigten Daten an den Client ausgeliefert.

✨ Was unterscheidet es?

Geschwindigkeit: Noch bevor ein Nachrichtenartikel erscheint, startet die Analyse sofort, sobald der Originaltext von Trumps Aussage veröffentlicht wird.
Kontextanalyse: Über LLM-Prompts wird herausgearbeitet: „Was bedeutet diese Aussage für Koreas Halbleiter- oder Automobilindustrie?“
Sauberer Feed: Durch ähnlicheitsbasierte Duplikatentfernung wird das Rauschen durch mehrfach auftauchende identische Meldungen minimiert.

🚀 Was ist als Nächstes geplant?

Aktuell erweitere ich die Erfassungskanäle; später sollen Echtzeit-Push-Benachrichtigungen für bestimmte Keywords (z. B. Samsung Electronics, Zölle usw.) hinzukommen.
Ich hoffe, das ist für alle, die sich für die Schnittstelle von IT und Wirtschaft interessieren, eine kleine Hilfe. Feedback ist jederzeit willkommen!
Vielen Dank.

8 Kommentare

 
roxie 2026-04-01

Es ist ein 403-Fehler aufgetreten.

 
[Dieser Kommentar wurde ausgeblendet.]
 
kangbit 2026-03-27

Danke! Ich habe das Projekt registriert!

 
brainer 2026-03-26

„Ehemaliger“ Präsident

 
kangbit 2026-03-26

Ich habe es nicht gründlich genug geprüft..!

 
mhpark 2026-03-26

Sieht so aus, als wäre das ein Text, der mit einem Modell geschrieben wurde, dessen Trainingsdaten von 2021.01 bis 2025.01 reichen, haha.

 
dankim0124 2026-03-25

Stylisch

Aber sind diese ein bis zwei Sätze pro Karte so etwas wie die Analyse der wirtschaftlichen Auswirkungen, ähnlich einer Zusammenfassung?
Falls nicht, wird mir auf meinem Bildschirm aktuell keine Information mit der Bezeichnung „Auswirkungsanalyse“ angezeigt.

 
kangbit 2026-03-26

Es wird nicht separat angezeigt.
Wir sollten wohl einmal besprechen, ob wir die Analyse der Auswirkungen in der Zusammenfassung stärker hervorheben können.
Vielen Dank!