Dies ist ein Explorer für koreanische Personas, der den von Nvidia veröffentlichten Datensatz Nemotron-Personas-Korea nutzt.
Dieser Datensatz ist ein synthetischer Datensatz im Umfang von 1 Million Koreanerinnen und Koreanern und enthält unter anderem Alter, Beruf, Region und Familienbeziehungen. Die Erstellungsmethode des Datensatzes sowie statistische Informationen werden unter https://de.news.hada.io/topic?id=28919 ausführlich beschrieben.
Die wichtigsten Funktionen des Persona-Explorers sind wie folgt.
-
Personas können gesucht oder ähnliche Personas gefunden werden. Zur Vergleichung der Ähnlichkeit wird das Qwen-Embedding-Modell verwendet.
-
Auf einer Karte kann die Bevölkerungsverteilung der Personas angezeigt werden. Dafür werden die im Datensatz enthaltenen Standortinformationen verwendet.
-
Mit Personas kann gesprochen werden. Sie können einfache Fragen beantworten.
Mit dem Qwen-0.6-Embedding-Modell wurden für den gesamten Datensatz 1024-dimensionale Embeddings extrahiert und als Hugging-Face-Datensatz erstellt. Da die Eigenschaft besteht, dass im *_persona-Feld Namen wiederholt vorkommen, können die Embedding-Werte auf Namen verzerrt sein.
- Hugging Face Nemotron-Personas-Korea-Qwen3-0.6B-embeddings
Noch keine Kommentare.