Update für „Blank.“ – Umstieg auf Gemma 4, Fehler mit doppelten richtigen Antworten behoben, Qualität falscher Antworten verbessert
(play.google.com)Das sind Neuigkeiten zum Update von Blank., der On-Device-AI-Lückentext-Quiz-App, die ich im vergangenen Februar vorgestellt hatte.
Das Feedback, das ihr damals in den Kommentaren gegeben habt, hat sehr dabei geholfen, die Entwicklungsrichtung festzulegen. Vielen Dank.
Vor allem der von deleuze angesprochene Bug, bei dem „bei 7 Fragen 5 richtige Antworten dasselbe Wort sind“, war ein schmerzhafter Hinweis und wurde zu einem zentralen Verbesserungspunkt dieses Updates.
Wichtige Änderungen
1. Gemma 3 1B → Gemma 4 E2B
Auch die Inference-Engine wurde von MediaPipe LlmInference auf Google AI Edge LiteRT umgestellt.
Die Stabilität beim Instruction Following hat sich verbessert, sodass auffällige Ausgaben, die vom Prompt abweichen, deutlich seltener geworden sind.
2. Fehler mit doppelten richtigen Antworten behoben
Ein Problem, bei dem dasselbe Lückenwort in mehreren Fragen wiederholt vorkam, wurde behoben.
Während ein Quiz aus einem einzelnen Dokument erzeugt wird, werden bereits verwendete Wörter verfolgt und ausgeschlossen.
3. Qualität der falschen Antwortoptionen verbessert
Bisher wurden einfach drei Dokumenten-Keywords zufällig ausgewählt und als falsche Antworten eingesetzt,
nun wurde das durch ein Scoring-System ersetzt.
- Sprachübereinstimmung mit der richtigen Antwort (Koreanisch↔Koreanisch, Englisch↔Englisch)
- Ähnlichkeit der Zeichenanzahl zur richtigen Antwort
- Vorrang für Wörter, die im selben Satz vorkommen
- Ähnliche Auftretenshäufigkeit im Dokument
Dadurch ist der Effekt, dass die richtige Antwort zu offensichtlich heraussticht, deutlich seltener geworden.
4. Funktion zum erneuten Lösen des Quiz hinzugefügt
Auf dem Ergebnisbildschirm kann mit demselben Dokument direkt erneut ein Quiz gestartet werden.
Das Leistungsproblem auf älteren Smartphones (newbie1004) ist wegen der grundlegenden Einschränkungen von On-Device-LLMs schwer vollständig zu lösen, aber ich hoffe, dass sich durch den Austausch von Modell und Engine zumindest einiges verbessert.
Eine iOS-Version (luclipse) wird geprüft, nachdem die Stabilisierung der Android-Version abgeschlossen ist.
Play Store: https://play.google.com/store/apps/details?id=com.shootsir.blank
Ich werde weiter daran arbeiten, die App zu verbessern. Feedback ist willkommen.
Noch keine Kommentare.