Target Speech Hearing (TSH)

KI-Headset ermöglicht selektives Hören einer Person

Robert Klatt

Mensch nutzt Headset zum selektiven Hören )(WU) notgnihsaW fo ytisrevinU - ebuTuoY tohsneercS(Foto: © 

Ein neues Headset kann mithilfe von Künstlicher Intelligenz (KI) die Stimme einer Person in lauten Umgebungen in Echtzeit herausfiltern. Die Technik soll in Zukunft Menschen mit deutlichen Hörbehinderungen helfen.

Seattle (U.S.A.). Forscher der University of Washington (UW) um Shyam Gollakota haben ein spezielles Headset entwickelt, das mithilfe einer Künstlichen Intelligenz (KI) das selektive Hören einer Person ermöglicht. Das Headset filtert dazu in Echtzeit andere Geräusche, etwa weitere Personen oder störende Umgebungsgeräusche, und lässt den Nutzer nur die gewünschte Person hören.

„Mit unseren Geräten kann man nun einen einzelnen Sprecher klar und deutlich hören, auch wenn man sich in einer lauten Umgebung befindet, in der viele andere Menschen sprechen.“

Um das sogenannte Target Speech Hearing (TSH) des Headsets nutzen zu können, muss lediglich die Stimme der sprechenden Person für drei bis fünf Sekunden aufgezeichnet werden. Anschließend erkennt das System die Stimme, filtert alle weiteren Umgebungsgeräusche raus. Laut der Publikation in den Proceedings of the CHI Conference on Human Factors in Computing Systems funktioniert das selektive Hören unabhängig davon, ob die Person sich bewegt oder ob diese sich in der unmittelbaren Nähe des Nutzers aufhält.

Künstliche Intelligenz (KI) analysiert Stimme

Zur Konfiguration des TSH muss das Headset lediglich zum Kopf der sprechenden Person ausgerichtet werden. Anschließend aktiviert der Nutzer die Funktion und das Headset zeichnet die Stimme des Sprechers, deren Schallwellen die Mikrofone an beiden Ohrmuscheln parallel erreichen, auf. Anschließend analysiert die im Headset integrierte KI die Stimme, um diesen mithilfe von erkannten Mustern aus den Umgebungsgeräuschen filtern zu können. Sobald die Konfiguration abgeschlossen ist, gibt das Headset die Stimme in Echtzeit wieder.

In Experimenten mit 21 Menschen wurde die Klarheit der Stimme im Mittel als doppelt so gut bewertet wie bei nicht gefilterten Audiodaten. In Zukunft soll das System verwendet werden, um Hörgeräte zu verbessern. Laut den Forschern könnte es Menschen mit einer deutlichen Hörbehinderung dabei helfen, die Stimmen einzelner Menschen wieder gut zu verstehen.

Proceedings of the CHI Conference on Human Factors in Computing Systems, doi: 10.1145/3613904.3642057

Spannend & Interessant
VGWortpixel