musn129: Zusammenfassungsdienst für US-Aktiennews
(musn129.com)Ein Dienst, der US-Aktiennews sammelt und zusammenfasst, warum Kurse steigen oder fallen.
Beim jüngsten Beispiel von Netflix am 2022-10-21 wird etwa die Zusammenfassung the company is reinvesting a huge chunk of its profits at a high rate of return bereitgestellt, zusammen mit einem Link zum entsprechenden Original-Nachrichtenartikel.
Ich interessiere mich sehr für US-Aktien, aber es war umständlich, morgens nach dem Aufstehen jedes Mal einzeln zu suchen und zu prüfen, warum Kurse gestiegen oder gefallen sind. Deshalb habe ich das entwickelt und teile es hier in der Hoffnung, dass es vielleicht hilfreich ist.
Technisch sieht es wie folgt aus.
- Besteht vollständig aus Serverless-Komponenten (AWS Lambda + Cloudfront Lambda@Edge)
- Nach dem Crawlen von News über US-Aktien werden die Ergebnisse mit einem Machine-Learning-Modell namens SQuAD inferiert (z. B.
Why Nvidia stock goes up?)- Verwendet wird ein leichtgewichtiges Modell, das problemlos auf Lambda laufen kann (Distillation-BERT-Reihe)
- Alle Lambda-Funktionen zur Datenerstellung laufen innerhalb des AWS Free Tier; zusätzliche Kosten fallen nur für S3 und die Domain-Kosten von Route 53 an (derzeit etwa $2 pro Monat)
- Alle Daten werden in S3 gespeichert, eine separate DB wird nicht verwendet
- SSR (NextJs) + Cloudfront Lambda@Edge (us-east-1)
Ich lese hier immer gerne mit und danke vielen von Ihnen sehr. Ich schreibe dies in der Hoffnung, dass es für Interessierte zumindest ein wenig hilfreich ist. Vielen Dank.
20 Kommentare
Hallo. Ich möchte euch mitteilen, dass es bei meinem zuvor gestarteten Side-Projekt musn129 große Änderungen gab.
Zunächst möchte ich mich herzlich bei allen bedanken, die großes Interesse gezeigt und den Dienst kontinuierlich genutzt haben.
Bisher wurden aus Gründen der Kostenoptimierung alle Berechnungen auf AWS Lambda ausgeführt, und für die Modellinferenz wurde Distillation BERT verwendet, um die SQuAD-Task zu lösen (z. B. indem man die Frage stellte: Warum ist diese Aktie im Artikel gestiegen?, und das Modell die Position der Antwort im Artikel finden ließ). Das wurde nun auf die kostenpflichtige API von OpenAI umgestellt. Die mit dem neuen Modell berechneten Daten gelten ab 2023. (2022 sind die bisherigen Daten.)
Da ich keine Bilder anhängen kann, hinterlasse ich zum Schluss noch das Ergebnis zu LUCID, das heute die größte Veränderung gezeigt hat. (Ihr könnt es unter https://musn129.com/nasdaq/2023-01-27 ansehen!)
Vielen Dank!
Es wäre großartig, wenn man eine Crypto-Version erstellen könnte. Der Crypto-Markt weist eine sehr starke positive Korrelation mit Nachrichten auf.
Wow … vielen Dank für diesen wirklich großartigen Service.
Unter ähnlichen Programmen scheint mir dieses mit am besten zu sein, auch die Benutzeroberfläche ist komfortabel. Ich habe Yahoo Finance, Dow Jones, Bloomberg usw. genutzt (ich bin kein Profi, sondern Privatanleger, daher habe ich zwar keine richtigen Programme verwendet), aber hier lassen sich die relevanten Artikel bequem lesen. Da jedoch jeder seine eigenen Werte hat, an denen er interessiert ist, wäre es schön, wenn man – auch ohne gleich ein Konto anzulegen – Favoriten markieren und bestimmte Titel fortlaufend verfolgen könnte. Ich werde es gut nutzen. Vielen Dank ^-^
Ich arbeite derzeit bei einer Wertpapierfirma. Ich würde das gern als Service entwickeln..??
Ich habe da noch eine Frage: Wenn ich Ihnen eine E-Mail schicke, würden Sie mir dann antworten?? hehe
Hallo! Vielen Dank für Ihr Interesse. Wenn Sie Fragen haben, hinterlassen Sie sie gern, dann antworte ich Ihnen! Falls es sich allerdings nicht um persönliche Inhalte handelt, wäre es vielleicht noch besser, wenn Sie sie hier hinterlassen, damit sie mit allen anderen geteilt werden können! Vielen Dank.
Ja. Ich habe sehr viele Fragen. :) Da ich mich technisch nicht so gut auskenne, frage ich einfach ganz entspannt einmal nach.
Könnte man die Genauigkeit dieses Projekts eventuell noch weiter erhöhen?
Ich vermute, das würde in eine Richtung gehen wie: die Menge an Nachrichten erhöhen, die Qualität der Nachrichten verbessern oder die Genauigkeit des Modells steigern.
Wenn man mehr Ressourcen investieren würde, würde mich interessieren, in welchem Maß sich die Genauigkeit des von Ihnen vorgestellten Dienstes noch verbessern ließe. haha
Ja, ich denke, man kann das deutlich verbessern. Ich habe das persönlich umgesetzt, und da es (noch) keine Einnahmen gibt, habe ich mich stark auf Kosteneffizienz fokussiert, weshalb es meiner Meinung nach noch viele Punkte zur Optimierung gibt.
Wie Sie gesagt haben, ist es wohl am wichtigsten, zunächst mehr qualitativ hochwertige Daten zu sichern. Soweit ich weiß, gibt es im Nachrichtenbereich viele SaaS-Angebote, die durch Crawling gute Datensätze aufgebaut haben. Wenn es also kein Einzelprojekt, sondern ein Projekt auf größerer Ebene wäre, könnte man für einen angemessenen Betrag externe kostenpflichtige SaaS-Dienste nutzen, um hochwertige Nachrichtenartikel zu sammeln.
Als Nächstes habe ich mich bei den aktuellen Modell-Ein- und -Ausgaben nicht besonders um Vorverarbeitung und Nachbearbeitung gekümmert. Wenn man sich die Modellergebnisse anschaut und gezielt daran arbeitet, qualitativ bessere Werte zu erhalten, würde das Resultat aus Sicht der Nutzer deutlich besser wirken. (Zum Beispiel habe ich derzeit auch kurze Antworten, die wenig sinnvoll wirken, oder Antworten, die wie Leerstellen aussehen, drin gelassen, weil die Datenmenge selbst gering ist und ich persönlich aus Neugier trotzdem einfach darauf klicken wollte. Auf Production-Niveau könnte man solche Dinge aber viel besser aufräumen und dadurch eine deutlich bessere User Experience bieten.)
Zum Schluss habe ich aus Kostengründen nur ein sehr leichtgewichtiges Modell genau einmal verwendet. Man könnte aber auch größere Modelle einsetzen, die zwar mehr Rechenaufwand erfordern, dafür aber relativ bessere Leistung bieten. Außerdem könnte man nicht nur den von mir gewählten Question-Answering-Ansatz verwenden, sondern auch auf verschiedene andere Methoden setzen, um passendere Ergebnisse zu erzielen.
Beim Schreiben ist es etwas lang geworden, aber ich hinterlasse das in der Hoffnung, dass es vielleicht auch anderen Interessierten hilft. Vielen Dank!
Wirklich großartig. Wow;;
Wenn sich die Genauigkeit ausreichend steigern lässt, könnte man ernsthaft sogar in Betracht ziehen, das direkt als echtes Produkt umzusetzen.
(Allein an den Reaktionen in den Kommentaren der Leute, die diesen Service gesehen haben, wirkt es schon fast so, als wäre die Validierung als Preto-Type(proto x, prito o) bereits vollständig abgeschlossen, haha.)
Als Produktplaner gab es für mich im Bereich Auslandsaktien im Wesentlichen zwei Punkte, über die ich nachgedacht habe.
Der eine waren physische oder technische Pain Points.
– Zum Beispiel abends handeln zu müssen / Geld umtauschen zu müssen / nur 15 Minuten verzögerte Kurse zu sehen / keine Orderbuchtiefe sehen zu können / nur wenige handelbare Länder zur Verfügung zu haben – also die Frage, wie sich solche Unannehmlichkeiten auflösen lassen, die durch die physische Distanz zwischen dem lokalen Markt und dem Markt vor Ort entstehen.
Allerdings hat sich dieser Teil inzwischen stark verbessert. Dank der Macht des Kapitals ... haha.
In letzter Zeit interessierte ich mich eher für das Thema Informationen und Content.
Man muss erst einmal gut Englisch können, und selbst wenn man gut Englisch kann, ist es schwierig, an Informationen aus dem Ausland zu kommen; außerdem gibt es so unglaublich viel, dass man gar nicht weiß, was und wie man überhaupt suchen soll. Man hat keine Zeit, es gibt zu viel zu sehen, Investieren ist schwierig, und niemand erklärt es einem ...
Deshalb machen Wertpapierfirmen gewöhnlich Dinge wie Content-Teams aufzubauen, Content von außen einzukaufen oder die Research-Abdeckung auf ausländische Titel auszuweiten – aber es ist noch ein weiter Weg. Außerdem braucht es überall noch manuelle Arbeit. Dadurch leidet dann auch die Aktualität ...
Genau deshalb hat mich der von Ihnen umgesetzte Service so beeindruckt.
Ich glaube, dass sich damit die tägliche User Experience deutlich verbessern lässt. Letztlich will man doch wissen: Warum ist es gestiegen? Warum ist es gefallen? Das ist es doch, oder? haha
Vielen Dank für die ausführliche Antwort! Das wird mir sehr helfen. Besonders die Einblicke aus der Praxis, die Sie geteilt haben, werden nicht nur mir, sondern auch anderen eine große Hilfe sein. Vielen Dank!! haha
Vielen Dank für das Projekt und auch für die Kommentare. Ich denke, das wird vielen anderen sehr helfen!
Ein wirklich großartiger Service!
Oft gibt es selbst dann, wenn eine Aktie stark gestiegen ist, keine klare Begründung, sondern nur Meldungen darüber, dass sie stark gestiegen ist. Ich frage mich, wie man solche Nachrichten gut filtern kann.
Hallo! Vielen Dank für Ihr Interesse. Ich denke, es gibt im Wesentlichen zwei Gründe, warum die Qualität nachlässt. Zum einen enthält der ursprüngliche Artikel selbst möglicherweise nicht ausreichend die gewünschten Inhalte, und zum anderen könnte das Ergebnis der Inferenz des Machine-Learning-Modells nicht gut genug sein. (Derzeit ist das Ganze noch ziemlich naiv umgesetzt, haha..)
Aktuell wird bei mehreren Artikeln nach dem
model output scoresortiert. Ich denke, man könnte das schnell verbessern, indem man sehr kurze Sätze herausfiltert (zum Beispiel solche, die wie derzeit sichtbar ganz leer oder zu kurz sind) oder noch einige zusätzliche Heuristiken verwendet. Vielen Dank für das wertvolle Feedback!Vielen Dank für die guten Meinungen und Ideen! Haha, ich werde nach und nach weitere Funktionen hinzufügen. Ich bekomme auf GeekNews immer sehr viel Inspiration, deshalb möchte ich bei dieser Gelegenheit auch sagen, wie dankbar ich dafür bin! Haha
Ich bin gespannt, was dabei wohl für koreanische Aktien herauskäme, haha.
Ich habe ohnehin schon darüber nachgedacht, auch koreanische Aktien aufzunehmen, also werde ich das nach und nach entwickeln und hinzufügen. Vielen Dank für Ihr Interesse, haha
Wow! Ein faszinierender Service. Da kommt mir der Gedanke, dass man auf diese Weise vielleicht auch analysieren könnte, wenn Songs bestimmter Künstler in den Musikcharts plötzlich wieder nach oben schießen.
Vielen Dank für die gute Anregung! Mit einem ähnlichen Ansatz könnte es, wenn nur genügend Daten vorhanden sind, tatsächlich sehr viele Dinge geben, die sich nutzen lassen!
Aktien ... steigen also auch ...? Komisch ... meine fallen irgendwie immer nur ...
Bitte teilen Sie sie auf GeekNews, bevor Sie neue Aktien kaufen.