Projekt B3 - Hierarchische Modelle der Verarbeitung akustischer Information und ihre Anwendung zur Quellendetektion und -hervorhebung

Kontakt

Projektleitung

Projekt B3 - Hierarchische Modelle der Verarbeitung akustischer Information und ihre Anwendung zur Quellendetektion und -hervorhebung

Das Projekt implementiert die Kommunikationsschleife des SFBs als Hierarchie aufeinanderfolgender Verarbeitungsebenen, in welchen das Schallfeld in eine abstrakte, invariante („high-level“) Repräsentation transformiert wird. Nach einer aktiven Hörentscheidung auf der obersten Ebene, entsprechend dem subjektiven Perzept, wird die Hierarchie in umgekehrter Reihenfolge („top-down“) durchlaufen.

Dies ermöglicht die Inferenz optimaler Parameter für ein assistives Hörsystem, das das Schallfeld entsprechend dem Nutzerwunsch modifiziert. Hierfür kombiniert das Projekt Psychoakustik zur Merkmalsextraktion, tiefe neuronale Netze zum Lernen in hierarchischen Architekturen und statistische Signalverarbeitung zur Parameterschätzung.

Publikationen

2024

Nustede EJ, Anemüller J (2024) On the generalization ability of complex-valued variational U-networks for single-channel speech enhancement. IEEE/ACM Transactions on Audio, Speech, and Language Processing 32: 3838-3849. DOI: 10.1109/TASLP.2024.3444492

2023

Nustede EJ, Anemueller J (2023) Exploring visualization techniques for interpretable learning in speech enhancement deep neural networks. Proc. ITG Conference on Speech Communication, Aachen, Germany, Sep. 2023, pp. 220-224. DOI: 10.30420/456164043,
https://ieeexplore.ieee.org/document/10363031
Nustede EJ, Anemüller J (2023) Single-channel speech enhancement with deep complex U-networks and probabilistic latent space models. 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Rhodes Island, Greece, 04-10.06.2023, pp. 1-5. DOI: 10.1109/ICASSP49357.2023.10096208

2022

2021

Nustede EJ, Anemüller J (2021) Towards speech enhancement using a variational U-Net architecture. In Proc. European Signal Processing Conference (EUSIPCO), Dublin, Ireland, Aug. 2021. https://eurasip.org/Proceedings/Eusipco/Eusipco2021/pdfs/0000481.pdf
Tammen M, Gode H, Kayser H, Nustede EJ, Westhausen NL, Anemüller J, Doclo S
(2021) Combining binaural LCMP beamforming and deep multi-frame filtering for joint dereverberation and interferer reduction in the Clarity-2021 Challenge. Technical report. https://claritychallenge.org/clarity2021-workshop/papers/Clarity_2021_paper_tammen.pdf
Urbschat A, Uppenkamp S, Anemüller J (2021) Searchlight classification informative region mixture model (SCIM): Identification of cortical regions showing discriminable BOLD patterns in event-related auditory fMRI data. Front Neurosci 14: 616906, 1-21. DOI: 10.3389/fnins.2020.616906

2020

Anemüller J, Schoof H (2020) Machine listening in spatial acoustic scenes with deep networks in different microphone geometries. Northern Lights Deep Learning Workshop (NLDL). DOI: 10.7557/18.5151
Urbschat A, Uppenkamp S, Anemüller J (2020) Searchlight Classification Informative Region Mixture Model (SCIM): Identification of cortical regions showing discriminable BOLD patterns in event-related auditory fMRI data. Frontiers in Neuroscience, 14:616906. DOI: 10.3389/fnins.2020.616906

2019

Anemüller J, Schoof, H (2019) Deep network source localization and the influence of sensor geometry. 23rd Proc. International Congress on Acoustics, Aachen, pp 110-113. pub.dega-akustik.de/ICA2019/data/articles/001302.pdf
Nustede EJ, Anemüller J (2019) Group delay features for sound event detection and localization (task 3) of the DCASE 2019 challenge. Detection Classification Acoust. Scenes Events Challenge, Technical report. Link to the paper

Webmaster des SFB (Stand: 02.12.2024) | Kurz-URL:Shortlink: https://uol.de/p56369 | # |

Sprache wechseln

Change Language

Hell-/Dunkelmodus

Light mode / Dark mode

Informationen für ...

Projekt B3 - Hierarchische Modelle der Verarbeitung akustischer Information und ihre Anwendung zur Quellendetektion und -hervorhebung

Kontakt

Projekt B3 - Hierarchische Modelle der Verarbeitung akustischer Information und ihre Anwendung zur Quellendetektion und -hervorhebung