Für spezifische Fragen bezüglich eines unserer Forschungsthemen kontaktieren Sie bitte die entsprechenden Personen direkt (siehe Liste der Mitarbeiter)

PEMO-Q

Vorhersage der Audio- und Sprachqualität für Normalhörende und Hörgeschädigte, basierend auf dem Oldenburger Perzeptionsmodell (PEMO)

Das Softwarepaket PEMO-Q dient der Vorhersage wahrgenommener Qualitätsunterschiede zwischen Audiosignalen. Es basiert auf der Arbeit von Huber und Kollmeier (2006), die ihrerseits den Ansatz von Hansen und Kollmeier (2000) erweitert haben, indem sie das Oldenburger Perzeptionsmodell ("PEMO") von Dau et al. (1996, 1997) zur Berechnung "interner Repräsentationen" von Signalpaaren verwenden. Diese internen Repräsentationen werden quantitativ verglichen, indem im Wesentlichen der lineare Kreuzkorrelationskoeffizient berechnet wird. Der resultierende Korrelationswert dient als objektives Maß für die wahrgenommene Ähnlichkeit zwischen zwei Audiosignalen.

Die Software wird als MATLAB®-Funktionen (als Pseudocode-Dateien [P-Dateien] mit zugehörigen mex-Dateien) unter den Betriebssystemen MS Windows®, LINUX und macOS bereitgestellt. Es umfasst drei Funktionen: "audioqual", "audioqual_hi" und "speechqual". audioqual ist die Implementierung des eigentlichen PEMO-Q-Verfahrens von Huber und Kollmeier (2006). audioqual_hi entspricht audioqual, erweitert für Hörbehinderungen. Die Erweiterung basiert auf der Arbeit von Derleth et al. (2001). Das erweiterte Audioqualitätsmodell wurde in Huber et al. (2014) vorgestellt. speechqual berechnet die von Hansen und Kollmeier (2000) beschriebene Sprachqualitätsmetrik "qc".

Sie können die PEMO-Q-Software gerne herunterladen und verwenden. Wenn Sie mit der Software erzielte Ergebnisse veröffentlichen, zitieren Sie bitte die entsprechenden Publikationen.

Referenzen

Dau, T., Püschel, D., and Kohlrausch, A. (1996). "A quantitative model of the 'effective' signal processing in the auditory system. I. Model structure," J. Acoust. Soc. Am 99(6), 3615-3622. DOI: 10.1121/1.414959
Dau, T., Kollmeier, B., and Kohlrausch, A. (1997). “Modeling auditory processing of amplitude modulation.” J. Acoust. Soc. Am. 102(5), 2892-2905. DOI: 10.1121/1.420344
Derleth, R.P., Dau, T., and Kollmeier, B. (2001). “Modelling temporal and compressive properties of the normal and impaired auditory system“. Hearing Research 159, 132-149. DOI: 10.1016/S0378-5955(01)00322-7
Hansen, M. and Kollmeier, B. (2000). "Objective modelling of speech quality with a psychacoustically validated auditory model," J. Audio Eng. Soc. 48(5), 395-409
Huber, R. and Kollmeier, B. (2006). "PEMO-Q–A new Method for Objective Audio Quality Assessment using a Model of Auditory Perception." IEEE Transactions on Audio, Speech and Language processing 14(6), 1902-1911. DOI: 10.1109/TASL.2006.883259
Huber, R., Parsa, V., and Scollie, S. (2014) “Predicting the perceived sound quality of frequency-compressed speech,” PLoS ONE 9(11):e110260. DOI: 10.1371/journal.pone.0110260

Download

PEMO-Q_v1.4.1.zip 596 KB
„PEMO-Q AudioQual and SpeechQual“ 210 KB

Webmaster (Stand: 20.06.2024) |

Sprache wechseln

Change Language

Hell-/Dunkelmodus

Light mode / Dark mode

PEMO-Q

Kontakt

Leitung

Sekretariat

Anschrift (Postanschrift)

PEMO-Q

PEMO-Q

Vorhersage der Audio- und Sprachqualität für Normalhörende und Hörgeschädigte, basierend auf dem Oldenburger Perzeptionsmodell (PEMO)

Referenzen

Download