Kontakt

Leitung

Prof. Dr. Dr. Birger Kollmeier

/ -

W30 3-313

Sekretariat

Katja Warnken

+49 (0)441 798-3902

W30 3-312

Anschrift (Postanschrift)

Medizinische Physik, Fakultät VI
Universität Oldenburg
26111 Oldenburg

Standort / Anreise

Für spezifische Fragen bezüglich eines unserer Forschungsthemen kontaktieren Sie bitte die entsprechenden Personen direkt (siehe Liste der Mitarbeiter)

PEMO-Q

PEMO-Q

Vorhersage der Audio- und Sprachqualität für Normalhörende und Hörgeschädigte, basierend auf dem Oldenburger Perzeptionsmodell (PEMO)

Das Softwarepaket PEMO-Q dient der Vorhersage wahrgenommener Qualitätsunterschiede zwischen Audiosignalen. Es basiert auf der Arbeit von Huber und Kollmeier (2006), die ihrerseits den Ansatz von Hansen und Kollmeier (2000) erweitert haben, indem sie das Oldenburger Perzeptionsmodell ("PEMO") von Dau et al. (1996, 1997) zur Berechnung "interner Repräsentationen" von Signalpaaren verwenden. Diese internen Repräsentationen werden quantitativ verglichen, indem im Wesentlichen der lineare Kreuzkorrelationskoeffizient berechnet wird. Der resultierende Korrelationswert dient als objektives Maß für die wahrgenommene Ähnlichkeit zwischen zwei Audiosignalen.

Die Software wird als MATLAB®-Funktionen (als Pseudocode-Dateien [P-Dateien] mit zugehörigen mex-Dateien) unter den Betriebssystemen MS Windows®, LINUX und macOS bereitgestellt. Es umfasst drei Funktionen: "audioqual", "audioqual_hi" und "speechqual". audioqual ist die Implementierung des eigentlichen PEMO-Q-Verfahrens von Huber und Kollmeier (2006). audioqual_hi entspricht audioqual, erweitert für Hörbehinderungen. Die Erweiterung basiert auf der Arbeit von Derleth et al. (2001). Das erweiterte Audioqualitätsmodell wurde in Huber et al. (2014) vorgestellt. speechqual berechnet die von Hansen und Kollmeier (2000) beschriebene Sprachqualitätsmetrik "qc".

Sie können die PEMO-Q-Software gerne herunterladen und verwenden. Wenn Sie mit der Software erzielte Ergebnisse veröffentlichen, zitieren Sie bitte die entsprechenden Publikationen.

Referenzen

  • Dau, T., Püschel, D., and Kohlrausch, A. (1996). "A quantitative model of the 'effective' signal processing in the auditory system. I. Model structure," J. Acoust. Soc. Am 99(6), 3615-3622. DOI: 10.1121/1.414959
  • Dau, T., Kollmeier, B., and Kohlrausch, A. (1997). “Modeling auditory processing of amplitude modulation.” J. Acoust. Soc. Am. 102(5), 2892-2905. DOI: 10.1121/1.420344
  • Derleth, R.P., Dau, T., and Kollmeier, B. (2001). “Modelling temporal and compressive properties of the normal and impaired auditory system“. Hearing Research 159, 132-149. DOI: 10.1016/S0378-5955(01)00322-7
  • Hansen, M. and Kollmeier, B. (2000). "Objective modelling of speech quality with a psychacoustically validated auditory model," J. Audio Eng. Soc. 48(5), 395-409
  • Huber, R. and Kollmeier, B. (2006). "PEMO-Q–A new Method for Objective Audio Quality Assessment using a Model of Auditory Perception." IEEE Transactions on Audio, Speech and Language processing 14(6), 1902-1911. DOI: 10.1109/TASL.2006.883259
  • Huber, R., Parsa, V., and Scollie, S. (2014) “Predicting the perceived sound quality of frequency-compressed speech,” PLoS ONE 9(11):e110260. DOI: 10.1371/journal.pone.0110260

Download

(Stand: 23.05.2022)