AI-Kopfhörer, mit denen man in einer Menschenmenge die Stimme einer einzelnen Person hören kann
(washington.edu)AI-Kopfhörer: In einer Menschenmenge nur die Stimme einer Person hören
Wichtige Punkte
-
Forschungshintergrund
- Geräuschunterdrückende Kopfhörer sind hervorragend darin, bestimmte Geräusche zu blockieren.
- Wenn Nutzer jedoch nur einen ganz bestimmten Klang hören möchten, stoßen sie an Grenzen.
-
Entwicklung eines neuen Systems
- Ein Team der University of Washington hat ein AI-System namens "Target Speech Hearing" entwickelt.
- Wenn der Nutzer Kopfhörer trägt und 3 bis 5 Sekunden lang eine bestimmte Person ansieht, kann er nur die Stimme dieser Person hören.
- Das System gibt diese bestimmte Stimme weiter wieder, auch wenn sich der Nutzer bewegt oder in eine andere Richtung schaut.
-
Verwendung
- Man trägt normale Kopfhörer mit Mikrofon, schaut eine bestimmte Person an und drückt einen Knopf.
- Die Kopfhörer lernen das Stimmmuster dieser Person und blenden andere Geräusche aus.
- Das System verfolgt die ausgewählte Stimme weiter, auch wenn sich der Nutzer bewegt.
-
Forschungsergebnisse
- In der Bewertung der Sprachverständlichkeit durch 21 Versuchsteilnehmer wurde das System als doppelt so klar wie herkömmliches Audio eingeschätzt.
- Derzeit kann immer nur eine Stimme gleichzeitig registriert werden, und bei lauten Geräuschen aus derselben Richtung ist die Erfassung schwierig.
-
Zukünftige Pläne
- Geplant ist, das System auf Earbuds und Hörgeräte auszuweiten.
Meinung von GN⁺
-
Nützlichkeit der Technik
- In lauten Umgebungen könnte es nützlich sein, die Stimme einer bestimmten Person klar zu hören, etwa in Meetings oder bei Vorträgen.
-
Grenzen der Technik
- Derzeit ist das System etwas eingeschränkt, da immer nur eine Stimme gleichzeitig registriert werden kann.
- Auch der Umstand, dass die Erfassung bei lauten Geräuschen aus derselben Richtung schwierig ist, muss verbessert werden.
-
Erweiterungspotenzial der Technik
- Wenn das System auf Earbuds und Hörgeräte ausgeweitet wird, könnte es noch mehr Nutzern helfen.
-
Konkurrenztechnologien
- Ein Vergleich mit anderen Geräuschunterdrückungstechnologien mit ähnlichen Funktionen ist nötig.
-
Praxistauglichkeit
- Vor einer tatsächlichen Kommerzialisierung sollte der Unterschied zwischen der Leistung im Forschungsstadium und der Leistung im Alltag berücksichtigt werden.
1 Kommentare
Hacker-News-Kommentare
Wenn es auf die Größe kleiner Ohrstöpsel schrumpfen würde, würde ich es als Mensch ohne Hörbehinderung gerne nutzen. Es könnte Situationen lösen, in denen es frustrierend ist, in einem geschäftigen Restaurant oder einer Bar Gespräche schlecht zu verstehen.
Die hohen Preise und Qualitätsprobleme von Hörhilfen. Selbst Geräte mit nur grundlegender Schallverstärkung sind sehr teuer. Außerdem stören sie im Ohr und führen dazu, dass man die Fähigkeit verliert, andere Geräusche herauszufiltern.
Facebooks AR-Forschung bietet eine günstige Experimentierplattform. Mit Eye-Tracking, Mikrofon-Array und Frontkamera ließe sie sich leicht zu einem einstellbaren Mikrofon umbauen.
Für Hörgeschädigte wäre so eine Funktion ein Geschenk des Himmels. Hoffentlich wird sie so schnell wie möglich in Hörhilfen integriert.
Diese Funktion könnte bei Tinnitus helfen. Wenn eine einzelne Person spricht, kann ich gut hören, aber wenn mehrere Menschen sprechen oder Musik läuft, höre ich gar nichts mehr.
Es werden Links zu Open-Source-Code und Forschungsarbeiten bereitgestellt. Ich frage mich, ob man es unabhängig betreiben kann.
Potenzial für kommerziellen Erfolg. Stellt euch eine Funktion vor, mit der man die Stimme einer lauten Person stummschalten kann.
Bei der Arbeit bei Sonos wurde an einer ähnlichen Funktion geforscht. Man wollte über einen ANC-Chipsatz eine Funktion entwickeln, mit der nur die Stimme einer bestimmten Person hörbar ist.
Code-Link vorhanden. (https://github.com/vb000/LookOnceToHear)
Wegen ADHS sind Gespräche in geschäftigen Räumen schwierig. Eine Funktion, die nur die Stimme des Gesprächspartners hörbar macht, wäre äußerst nützlich.
Kopfhörer mit ANC könnten zu Hause nützlich sein. Eine Funktion, die automatisch die Stimme des Partners durchlässt, wäre schön.