Navigation

'Analyse der menschlichen und algorithmischen Fähigkeit zur Schätzung der relativen Sprecherausrichtung'

Masterarbeit:  Sven Franz

Abgabetermin: 30.03.2012

Gutachter: Prof. Dr.-Ing. Jörg Bitzer, Prof. Dr. ir. Simon Doclo


Zusammenfassung

Diese Arbeit befasst sich mit der Wahrnehmung und Unterscheidungsfähigkeit der relativen Sprecherausrichtung von normalhörenden Menschen und von Signalverarbeitungsalgorithmen. Die Ziel dieser Arbeit war die Entwicklung von Signalverarbeitungsalgorithmen für binaural gekoppelte Hörgeräte, die in der Lage sind, Hauptsprecher in einer Multi-Sprecher Situation zu bestimmen und so eine Richtungsschätzung mit einer zusätzlichen Information für eine verbesserte Ausrichtung von Richtmikrofonen zu unterstützen. Ein sinnvolles Attribut für einen Hauptsprecher stellt die Sprecherausrichtung relativ zum Empfänger dar, da sich diese bei einer Konversation meist anschauen. Zusätzlich stellte sich die Frage, inwieweit normalhörende Probanden in der Lage sind, unterschiedliche Sprecherausrichtungen zu detektieren. Diese Fähigkeit wurde in unterschiedlichen Hörversuchen betrachtet und ausgewertet. Die Wahrnehmung und Unterscheidungsfähigkeit der Sprecherausrichtung wurde bisher wenig untersucht. Entsprechende Signalverarbeitungsalgorithmen existieren bereits, basieren abermeist auf großen Mikrofonarrays oder räumlich verteilten Mikrofonen und sind daher ungeeignet für Hörgeräte. Für die Entwicklung neuer Ansätze war es erforderlich, die Einflüsse der relativen Sprecherausrichtung auf die empfangenen Sensorsignale zu untersuchen, z.B. binaurale Eigenschaften und der Einfluss auf den Direktschall und die frühen Reflexionen. Drei unterschiedliche Algorithmen werden vorgestellt und evaluiert. Der erste Algorithmus nutzt die durch die Kopfabschattung entstehenden Klangverfärbungen des Nutzsignals. Die anderen Algorithmen nutzen das Verhältnis zwischen Direktschallanteile und frühen Reflexionen mit Hilfe des globalen Kohärenzfelds bzw. dem LPC-Restsignal. Es zeigt sich, dass die Sprecherausrichtung mithilfe des LPC-Restsignals am besten unterschieden werden kann.

Abstract

This thesis addresses the ability to distinguish and discriminate the facing angle of another speaker for normal hearing subjects and signal processing algorithms. The motivation is the developement of algorithms for binaural hearing aids which are able to determine the main speaker in multiple-speakers situations. This additional information should lead to an improvement of the time delay estimation. One relevant property of amain speaker is his facing angle relative to the receiver. The facing angle discrimination of normal hearing subjects was evaluated in experiments. So far, few investigations cover this topic. Existing signal processing algorithms usually employ arrays with a large number of microphones or spatial distributions not suitable for hearing aids. New approaches were developed by evaluation of the influence of the facing angle on the received sensor signals. In order to do so, binaural cues and the influence of direct sound and early reflectionswere investigated. Three different algorithms are presented and evaluated. The first algorithm makes use of differences in the frequecy domain resulting from the head shadow effect. The other algorithms use the ratio between direct sound and early reflections by means of the global coherence field or the LPC-residual respectively. It is shown that the best discrimination of different facing angles can be achieved using the LPC-residual.


Download Masterarbeit: PDF-Dokument [Download]



HuAav8w+-Webmasc7nategkflwrzlxef (simojlenn.christopfjo1h.berning@8o4uol8fb.de) (Stand: 07.11.2019)