Awesome koreanische Spracherkennung
(github.com/rtzr)(Scheint eher für SHOW geeignet zu sein, aber da ich es nicht selbst erstellt habe, poste ich es statt in SHOW unter NEWS.)
====
Dies ist ein Repository, das für Spracherkennungs-APIs von Entwicklerseiten die Fehlerrate (Character Error Rate) verschiedener von AI-Hub veröffentlichter Testsets misst, mit denen sich koreanische Spracherkennung ausprobieren lässt. Dieses Repository behandelt unter anderem folgende Inhalte.
- Messung der Fehlerrate (Character Error Rate) für AI-Hub-Testsets mit verschiedenen Spracherkennungs-APIs wie Return Zero, Google, OpenAI Whisper, ETRI und Naver
- Einführung in Methoden zur Bewertung koreanischer Spracherkennung
====
Dieses Projekt wurde veröffentlicht, um die Leistung verschiedener Spracherkennungs-APIs objektiv zu bewerten. Es soll die Leistungsunterschiede der derzeit am Markt verfügbaren Spracherkennungsdienste analysieren und dadurch Nutzern und Entwicklern einen besseren Zugang ermöglichen.
Als Paper veröffentlichte Materialien bewerten die Leistung in der Regel nur für Englisch und veröffentlichen WER (Word Error Rate) auf paperswithcode. Für koreanische Spracherkennung ist jedoch eine Bewertung mit CER (Character Error Rate) statt WER angemessen, doch ein gut aufbereitetes Leaderboard war nicht zu finden.
KsponSpeech wurde zwar 2018 erstmals veröffentlicht, konnte aber nicht über verschiedene Ressourcen breit bereitgestellt werden, da auf AI-Hub nur Inländer zugreifen können und es nur wenige koreanische Forschende und Entwickler im Bereich Spracherkennung gibt.
Return Zero betreibt eigene Forschung und Entwicklung zur Spracherkennung und hat dazu beigetragen, dass mehr Menschen Zugang zu solchen Ressourcen erhalten: KsponSpeech wurde als in der Spracherkennung häufig genutzter Beitrag in speechbrain eingebracht, sodass es nun im aktuellen recipe genutzt werden kann; außerdem wurde auch ein Zugang über huggingface ermöglicht.
In letzter Zeit wurden auf AI-Hub verschiedenste Arten von Sprachdaten veröffentlicht, und ich denke, dass es der Weiterentwicklung der koreanischen Spracherkennung hilft, zu evaluieren und bekannt zu machen, wie weit koreanische Spracherkennungs-Engines bei diesen vielfältigen Datensätzen inzwischen gekommen sind.
Noch keine Kommentare.