Charcuterie – Unicode-Explorer auf Basis visueller Ähnlichkeit
(charcuterie.elastiq.ch)- Ein Tool zur visuellen Erkundung des Unicode-Zeichensatzes, mit dem sich Glyphen, Schriften, Symbole und Formen einzelner Zeichen betrachten lassen
- Zur Analyse der visuellen Ähnlichkeit zwischen Zeichen nutzt es SigLIP-2-Embeddings, um Glyphen im Vektorraum zu vergleichen
- Nutzer können die morphologischen Beziehungen zwischen Zeichen intuitiv erfassen und die Unicode-Struktur erkunden
- Die Oberfläche bietet ein visuell ausgerichtetes Explorationserlebnis, das komplexe Zeichensysteme leichter verständlich macht
- Das Projekt wird kontinuierlich weiterentwickelt und erhält Feedback sowie Unterstützung durch Spenden
Überblick über Charcuterie
- Ein visueller Unicode-Explorer, mit dem sich Zeichensätze erkunden und zugehörige Glyphen, Schriften, Symbole und Formen anzeigen lassen
- Zur Analyse der visuellen Ähnlichkeit einzelner Zeichen werden mit SigLIP 2 gerenderte Glyphen eingebettet und im Vektorraum verglichen
- Nutzer können die morphologischen Beziehungen zwischen Zeichen intuitiv erkunden und die Struktur des Unicode-Standards verstehen
- Das Projekt wird kontinuierlich weiterentwickelt und erhält Feedback sowie Unterstützung durch Spenden
1 Kommentare
Hacker-News-Kommentare
Ich verstehe, dass das automatische Trimmen des Eingabefelds generell ein nützlicher Standard ist, aber hier ist es unpraktisch, weil man dadurch Leerzeichen selbst nicht suchen kann
Deshalb wäre es gut, eine Ausnahme wie
if (trim(str)=="") return strhinzuzufügenDas war mir anfangs nicht klar, aber wenn man auf das Stiftsymbol klickt, kann man direkt Formen zeichnen und danach suchen statt Text einzugeben
Ein wirklich tolles Konzept und eine starke Umsetzung
Allerdings ist das „Spotlight“-UI-Konzept etwas verwirrend. Wenn man auf ein Zeichen klickt, wird der umliegende Bereich hervorgehoben, und die ähnliche Zeichenlandschaft um dieses Zeichen wird erneut geladen. So kann man die Ähnlichkeitslandschaft erkunden, aber es fühlt sich an, als würde mir ein Teil der visuellen Metapher entgehen
So cool, dass ich es sofort zu meinen Lesezeichen hinzugefügt habe. Früher habe ich EmojiDB für die vektorbasierte Emoji-Suche verwendet, jetzt will ich das zusammen damit nutzen
Meine Seite ist unicode-atlas.vercel.app
Ich musste lachen, als ich gesehen habe, wie viele „X“-Zeichen es gibt
Wenn man den Link charcuterie.elastiq.ch/#1100B ansieht, ist unklar, ob „Aegean Check Mark“ oder „Old North Arabian letter Teh“ gemeint ist
Wirklich großartig. Ich bevorzuge, wenn möglich, Unicode-Zeichen statt Bilder zu verwenden. Zum Beispiel bei Pfeilen; es war immer schwer, genau das richtige Zeichen zu finden
Hier kann man aber ‼ es einfach selbst zeichnen und so eingrenzen, was man sucht. Perfekt. Auch die UX ist intuitiv, deshalb habe ich es sofort als Lesezeichen gespeichert
Ich wusste nicht einmal, dass es dieses Zeichen gibt: U+119A
Meine Seite ist unicode-atlas.vercel.app
Es scheint mehr als nur visuelle Ähnlichkeit zu berücksichtigen. Sonst gäbe es keinen Grund, warum „@“ und „U+1F582 (BACK OF ENVELOPE)“ so nah beieinander liegen sollten
Und ich habe mir seit Jahren, nein, seit Jahrzehnten gewünscht, dass Word so eine Funktion hat. Ich kann ein Symbol mit Worten beschreiben, aber die UI ist so umständlich, dass es schwer ist, es tatsächlich zu finden. Ich kann immer noch nicht glauben, dass das Fenster „Symbol einfügen“ keine Suchfunktion hat
Meine Seite ist unicode-atlas.vercel.app
Die japanische Kanji-Suche funktioniert nicht
https://unicodeplus.com/U+2F8F funktioniert, aber
https://unicodeplus.com/U+884C nicht
Ich fand es beeindruckend, dass man oben links ein Zeichen selbst zeichnen kann, um ähnliche Zeichen zu finden. Das zeigt, dass es mehr als nur eine einfache Lookup-Tabelle ist
Meine Seite ist unicode-atlas.vercel.app
Der Unicode-Standard definiert keine visuelle Form für Codepoints (abgesehen von einigen Emoji-artigen Ausnahmen)
Deshalb ist dieses Tool nur eine Visualisierung von Glyphenähnlichkeiten in einer bestimmten Schriftart (die weder genannt wird noch geändert werden kann), getrennt von einer „visuellen Erkundung“ von Unicode-Codepoints selbst