Vergleich, wie gut VLMs den Blick von Nutzern mit realen Eye-Tracking-Daten vorhersagen können
(arxiv.org)Hallo. Bei den anderen News gibt es immer Leute, die sie schneller posten als ich, deshalb ist Show GN irgendwie mein erster Beitrag geworden.
Ich war neugierig, ob sich mit VLMs vorhersagen lässt, wohin Nutzer in einer UI schauen, und habe deshalb selbst ein Experiment durchgeführt und es in einem Paper zusammengefasst.
Mithilfe des Datensatzes UEyes habe ich die Blickvorhersagen von VLMs mit realen Eye-Tracking-Daten verglichen.
Für das endorsement auf arXiv habe ich auch den Erstautor von UEyes (cs.HC) 1 kontaktiert, und er hat es freundlicherweise sofort akzeptiert.
paper: https://arxiv.org/abs/2604.26352
github: https://github.com/dunward/uigaze
Noch keine Kommentare.