Wie wird der erste Bildschirm bestimmt, den du siehst? Die Geschichte der personalisierten Empfehlungen für Musinsa-Home-Banner

(medium.com)

2 Punkte von GN⁺ 2025-06-05 | 1 Kommentare | Auf WhatsApp teilen

Home-Banner sind der zentrale Bereich, den Kundinnen und Kunden auf dem ersten Bildschirm als Erstes sehen. Mit einem hyperpersonalisierten Empfehlungssystem werden Klickrate (CTR) und Nutzererlebnis maximiert.
Statt der bisherigen einfachen CTR-Optimierung auf Basis von MAB (Multi-Armed Bandit) werden aktuelle Algorithmen wie DeepFM, Two-Tower und HGNN sowie graphbasierte Embeddings eingesetzt, um Banner- und Nutzereigenschaften präzise abzubilden.
Domänenspezifische Probleme wie kurze Banner-Lebenszyklen, verrauschtes Klick-Feedback und unausgewogene Daten werden durch Continual Learning sowie den kombinierten Betrieb einzelner und integrierter Modelle gelöst.
Am Ende wurde eine systematische Empfehlungs-Pipeline aufgebaut, die die CTR um mehr als 16 % verbessert, neue Banner und Cold User unterstützt und Echtzeit- sowie Business-Policies einbindet.
Künftig ist eine kontinuierliche Weiterentwicklung geplant, darunter Realtime Serving, Multi-Task Learning, bessere Embedding-Qualität und die Einführung vielseitiger Erfolgsmetriken.

Mit kundenspezifischen Big Banners ein besseres Erlebnis schaffen

Mit wachsendem Kundengeschmack und zunehmender Vielfalt der ausgespielten Inhalte stieß eine einheitliche Banner-Ausspielung an Grenzen, wenn es darum ging, ein zufriedenstellendes Erlebnis zu bieten.
Mit dem Ziel der Maximierung der CTR wurde ein Projekt umgesetzt, das für die großen Banner am oberen Rand jeder Store-Startseite eine personalisierte Ausspielungslogik einführt.

Bedeutung und Eigenschaften von Home-Bannern

Home-Banner sind im Musinsa-Service die sliderartigen Banner ganz oben auf dem Bildschirm, denen Kundinnen und Kunden zuerst begegnen (insgesamt 35 Stück). In der App wird eines, im Web werden drei angezeigt.
Etwa 97 % des gesamten Musinsa-Traffics sehen beim Betreten der Hauptseite ein Home-Banner.
Klicks auf Home-Banner machen 35 % aller Klicks aus und entfallen auf 37 % der Sessions mit Klickereignissen.
Durch die hohe Ausspielfrequenz ist dies ein Bereich mit sehr großem Effekt auf die Business-Conversion.

Grenzen des bisherigen Empfehlungsverfahrens

Bisher wurden Empfehlungen mithilfe des MAB-Algorithmus (Multi-Armed Bandit) durchgeführt, mit Fokus auf die CTR.
- Ausbalancierung von Exploration und Exploitation
Drei Einschränkungen:
- Abhängigkeit von einer einzigen CTR-Metrik, wodurch unterschiedliche Kundenvorlieben und Bannereigenschaften nur unzureichend berücksichtigt werden
- Schwierige Berücksichtigung von Banner-Zusammenhängen (unabhängige Verarbeitung)
- Cold Start (Leistungsabfall, wenn für neue Banner zu wenig Klickdaten vorliegen)
Um diese Grenzen zu überwinden, wurde ein neues Empfehlungssystem entworfen.

Pipeline des Empfehlungssystems

Das System besteht aus einer mehrstufigen Pipeline.
1. Stärkung der Banner-Repräsentation: Gewinnung von Embeddings auf Basis bannerbezogener Texte, Bilder und verknüpfter Produkte (unter Verwendung von HGNN und GraphSAGE)
2. Training eines Klickvorhersagemodells: Gleichzeitiger Einsatz von DeepFM (Feature-Interaktionen) und Two-Tower (getrennte User-/Banner-Embeddings)
3. Banner-Scoring und Anwendung: Batch- oder Echtzeit-Berechnung der prognostizierten CTR-Scores pro Nutzer
  - Für Nutzer mit ausreichend Daten: feingranulare Personalisierung
  - Für neue bzw. Cold User: segmentbasierte Empfehlungen
4. Berücksichtigung von Business-Policies: Zusätzlich zur Systembewertung werden Unternehmensrichtlinien und -strategien, Kampagnenbanner, dringende Änderungen usw. in Echtzeit reflektiert.
5. Endgültige Bannerausspielung: Empfehlung und Anzeige der Top-N-Banner mit den höchsten Scores

Einführung in die Kernmodelle der Empfehlung

DeepFM: Parallele Struktur aus FM (Interaktionen 2. Ordnung) und DNN (hochdimensionale Interaktionen), lernt sowohl aus spärlichen Daten als auch aus komplexen Interaktionen effektiv und ist hervorragend für CTR-Vorhersagen geeignet.
Two-Tower: Extrahiert Embeddings für Nutzer und Banner jeweils aus unabhängigen neuronalen Netzen, ist stark bei großen Datenmengen und Realtime Serving und eignet sich für ähnlichkeitssbasierte Empfehlungen.

DeepFM

Kombination aus FM-Layer (Feature-Interaktionen 2. Ordnung) und DNN-Layer (hochdimensionale nichtlineare Integration von Features)
Robust gegenüber spärlichen Daten und konsistente Leistungsoptimierung durch End-to-End-Lernstruktur
Verwendet Nutzerinformationen, Banner-Metadaten und Embedding-Informationen (64 Dimensionen) als Features.
Embedding-Vektoren werden als ein einzelner Block verarbeitet, um Trainingseffizienz und Stabilität sicherzustellen.
Die CTR-Vorhersageergebnisse werden zur Berechnung des Banner-Rankings verwendet.

Two-Tower

Nutzer und Banner werden in getrennten neuronalen Netzen (Towers) eingebettet, anschließend wird die Ähnlichkeit berechnet.
Bietet Skalierbarkeit für große Datenmengen sowie schnelle Reaktionen durch vorab vektorisierte Berechnung (niedrige Latenz).
Nutzt in jedem Tower unterschiedliche Eingabedaten wie Demografie, Verhaltenslogs, Text und Bilder.
Dank getrennter Trainings- und Parallelverarbeitungsstruktur lässt sich schnell und flexibel auf große Empfehlungsprobleme reagieren.

Zentrale Herausforderungen in der Praxis

Home-Banner haben einen sehr kurzen Lebenszyklus (2 bis 3 Tage, teils nur stundenweise), weshalb eine Echtzeit-Reaktion nötig ist.
Das Feedback-Signal basiert hauptsächlich auf Klicks, was es erschwert, echte Nutzerpräferenzen zu identifizieren.
Im Unterschied zu Produkten oder Marken verfügen Banner nur über wenige strukturierte Metadaten, und Kontext aus Bildern oder Texten ist schwer zu erfassen.
Datenungleichgewichte zwischen Stores (Unterschiede bei Traffic und Aktivität je Spezialbereich) können die Gesamtleistung verschlechtern.
Um diese Probleme zu überwinden, wurde das System entlang von drei technischen Achsen neu gestaltet: stärkere Ausdruckskraft, Aktualität und Abmilderung von Ungleichgewichten.

Konkrete Verbesserungsmaßnahmen

Stärkung der Bannereigenschaften

Um die Grenzen des Durchschnitts von PinSAGE-Embeddings zu überwinden (schwache Darstellung komplexer Banner, keine Empfehlung neuer Banner), wurde HGNN eingeführt.
Auf Basis von Nutzerverhaltensmustern werden Banner-Produkt-Beziehungen in einer Graph-Struktur mit GraphSAGE eingebettet.
Für Text- und Bildinformationen wird eine Kombination von LLM-Embeddings verwendet.
Durch Echtzeit-Aktualisierung der Nutzer-Embeddings und Einführung von Continual Learning werden aktuelle Nutzerinteressen berücksichtigt.
CTR-Anstieg um 8,3 %

Continual Learning

Statt eines Batch-Trainings auf dem gesamten Datenbestand wurde eine kontinuierliche Aktualisierung eingeführt (stündlich, mit Logs der letzten 3 Stunden).
Die Lernrate wird je nach Aktivitätsniveau dynamisch angepasst (unter der Woche maximal 5-fach, nachts 2-fach).
Dadurch werden schnelle Anpassung und Vermeidung von Modellalterung erreicht sowie schnelle Empfehlungsanpassungen ohne Leistungseinbruch ermöglicht.
CTR-Anstieg um 24 %

Strategische Modellauswahl

Die optimale Modellierungsstrategie wurde für jeden Store festgelegt.
Für den Main Store wurde DeepFM + Continual eingesetzt, für Spezialbereiche individuelle Two-Tower-Modelle, mit einer CTR-Verbesserung von 19 %.

Endergebnisse

Gegenüber dem bisherigen MAB stieg die CTR um 11,2 % bei Two-Tower bzw. 16,1 % bei DeepFM.
Für Musinsa Home wurde DeepFM + Continual Learning in der Praxis ausgerollt, für Spezialbereiche das Two-Tower-Modell.

Ausblick

Geplant ist eine weitere Verbesserung durch den Wechsel zu einer Realtime-Serving-Architektur, die Einführung von Multi-Task Learning (CTR + GGMV), die Verbesserung von Embedding-Qualität und Graph-Struktur sowie eine Diversifizierung der Erfolgsmetriken.
Das Modell soll sich von einer reinen CTR-Perspektive weiterentwickeln hin zur Bewertung verschiedener Business-Ziele und qualitativer Erfahrungen.

1 Kommentare

codemasterkimc 2025-06-05

Ein guter Artikel ~

Wie wird der erste Bildschirm bestimmt, den du siehst? Die Geschichte der personalisierten Empfehlungen für Musinsa-Home-Banner

Mit kundenspezifischen Big Banners ein besseres Erlebnis schaffen

Bedeutung und Eigenschaften von Home-Bannern

Grenzen des bisherigen Empfehlungsverfahrens

Pipeline des Empfehlungssystems

Einführung in die Kernmodelle der Empfehlung

DeepFM

Two-Tower

Zentrale Herausforderungen in der Praxis

Konkrete Verbesserungsmaßnahmen

Stärkung der Bannereigenschaften

Continual Learning

Strategische Modellauswahl

Endergebnisse

Ausblick

Verwandte Beiträge

1 Kommentare