1 Punkte von tantara 26 일 전 | Noch keine Kommentare. | Auf WhatsApp teilen

Dies ist ein Explorer für koreanische Personas, der den von Nvidia veröffentlichten Datensatz Nemotron-Personas-Korea nutzt.

Dieser Datensatz ist ein synthetischer Datensatz im Umfang von 1 Million Koreanerinnen und Koreanern und enthält unter anderem Alter, Beruf, Region und Familienbeziehungen. Die Erstellungsmethode des Datensatzes sowie statistische Informationen werden unter https://de.news.hada.io/topic?id=28919 ausführlich beschrieben.

Die wichtigsten Funktionen des Persona-Explorers sind wie folgt.

  1. Personas können gesucht oder ähnliche Personas gefunden werden. Zur Vergleichung der Ähnlichkeit wird das Qwen-Embedding-Modell verwendet.

  2. Auf einer Karte kann die Bevölkerungsverteilung der Personas angezeigt werden. Dafür werden die im Datensatz enthaltenen Standortinformationen verwendet.

  3. Mit Personas kann gesprochen werden. Sie können einfache Fragen beantworten.

Mit dem Qwen-0.6-Embedding-Modell wurden für den gesamten Datensatz 1024-dimensionale Embeddings extrahiert und als Hugging-Face-Datensatz erstellt. Da die Eigenschaft besteht, dass im *_persona-Feld Namen wiederholt vorkommen, können die Embedding-Werte auf Namen verzerrt sein.

Noch keine Kommentare.

Noch keine Kommentare.