Kontakt

Leitung

Prof. Dr.-Ing. Gerald Enzner

+49 (441) 798 3211

W2 0-068

Postanschrift

Sprachtechnologie und Hörgeräte
Carl von Ossietzky Universität Oldenburg
D-26111 Oldenburg, Germany

Wegbeschreibung 

Bachelor- und Masterarbeiten

BigBlueButton Audio Analyse

Die Nachfrage nach Sprach- und Videokonferenzlösungen für die entfernte und dennoch persönliche Kommunikation hatte in den letzten Jahren zwangsweise stark zugenommen. Die Mehrwerte der Systeme wollen auch jenseits der Pandemiezeit weiter genutzt werden. BigBlueButton (BBB) ist ein solches Open-Source-Webkonferenzsystem, was an der Universität Oldenburg erste Wahl ist. Für eine natürliche Kommunikation ist es dabei unter anderem notwendig, akustisches Übersprechen zwischen Mikrofon und Lautsprecher, welches als störendes Echo der eigenen Stimme wahrgenommen wird, zu verhindern. Hierfür setzt BBB eine automatische akustische Echo-Unterdrückung (engl. acoustic echo control, AEC) ein. Diese AEC ist Teil des Audioverarbeitungs-Moduls, das zusammen mit weiteren Algorithmen die Sprachverbesserung des Mikrofonsignals leistet. Das Modul basiert auf dem WebRTC Standard, was eine der gängigsten Webbrowser Bibliotheken ist und die Echzeitkommunikation über Peer-to-Peer-Verbindungen ermöglicht.

In der Bachelorarbeit soll ein Überblick der Verarbeitungs-Module des Webkonferenzdienstes BBB gegeben werden, insbesondere WebRTC. Dabei soll die Verknüpfung der Module zueinander und deren Schnittstellen nach außen herausgearbeitet werden, wobei der Fokus auf der AEC des
Audioverarbeitungs-Moduls liegen soll. Die Grundlage dafür liefert der durch WebRTC/BBB gegebene Quelltext. Um die herausgearbeitete Struktur zu demonstrieren, soll eine Analyse in Bezug auf die Verarbeitung und Übertragung der Signale erfolgen, die durch das BBB Audioverarbeitungs-Modul prozessiert wurden. Zur Analyse kommen eigens gewählte Sprachsignale aus einschlägigen Datenbanken zum Einsatz. Die zu verarbeitenden Mikrofonsignale und die verarbeiteten Sendesignale aus dem BBB Modul sollen in der Bachelorarbeit mit relevanten instrumentellen Metriken, wie etwa ERLE im Einzelsprechen, PESQ im Gegensprechen oder AECMOS im Gesamtkontext, bewertet werden.

Kontakt: Prof. Dr.-Ing. Gerald Enzner (, Raum W2-0-068) und Svantje Voit (, Raum W2-074).

 

Bachelorarbeit: Einrichtung eines adaptiven „BENCH“ Beamformers

Der BENCH Algorithmus (engl. Blind Equalization and Channel Identification) ist ein Verfahren zur automatischen Feststellung der Nutzsignalausrichtung eines Mikrofonarrays. Es kann sich dabei um lineare, zirkuläre oder beliebige Anordnungen von Mikrofonen handeln, da die akustische Übertragungsfunktion von der Quelle zu den Mikrofonen als abstrakte Richtungsinformation betrachtet wird. Mit dieser Information leistet BENCH außerdem eine Fokussierung auf das Nutzsignal zur Verbesserung der Geräusch- und Nachhallcharakteristik des Aufnahmeraumes. Die Formulierung des BENCH Algorithmus und der Nachweis seiner Funktion wurde für konzentrierte Mikrofonarray erbracht.

Ihre Aufgabe liegt im Entwurf einer verteilten Mikrofonanordnung wie sie im Szenario von ad-hoc gebildeten akustischen Sensornetzwerken abzusehen ist. Der Entwurf soll sich an der Vorstellung mehrerer Videokonferenzteilnehmer mit mehreren Geräten im selben Raum orientieren. Diese Situation birgt im praktischen Betrieb derzeit erhebliche technische Probleme und insofern Herausforderungen für die Forschung. In der Arbeit soll der BENCH Algorithmus auf den betreffenden Mikrofonsignalen ausgeführt und im Hinblick auf Sprachqualität und Geräuschfilterung bewertet werden. Als Werkzeuge für die Echtzeitausführung des Algorithmus kommen handelsübliche mehrkanalige Soundkarten sowie die Matlab/Simulink Software für die Signalverarbeitung auf PC zum Einsatz.

Kontakt: Prof. Dr.-Ing. Gerald Enzner (, Raum W2-0-068) und Dr.-Ing. Aleksej Chinaev (, Raum W2-073)

Bachelorarbeit: Virtuelles Audiokabel für die Sprachtechnologie

Die Algorithmenforschung im Bereich der Sprach- und Audiosignalverarbeitung nutzt gerne leistungsfähige und praktische Plattformen auf PC-Basis für die prototypische Umsetzung mit Echtzeitverhalten. Signale werden acquiriert, prozessiert und für die demonstrative Wiedergabe mit verschiedenen Höroptionen vorbereitet. Hierzu gibt es verschiedene Treiber- und Signalverarbeitungsarchitekturen sowohl für Windows als auch für Linux-Betriebssysteme. Weiterhin besteht Bedarf zur Übertragung der Signale zu einem Abhörraum oder zu einem fernen Ende, wie etwa im Kontext der Sprachkommunikation.

In der Bachelorarbeit soll ein PC-basiertes System zur Audioaufnahme und zur algorithmischen Audiosignalverarbeitung eingerichtet werden. Hierzu kommt je nach Erfahrungswerten entweder ein Linux- oder Windows-Betriebssystem zum Einsatz. Die Komponenten des Systems werden von der analogen Mikrofonaufnahme über die analoge Verstärkung und Digitalisierung bis hin zur Erfassung in einer Verarbeitungssoftware (wie z.B. Simulink) arrangiert. Ein besonders Augenmerk der Arbeit betrifft die Übergabe von verarbeiteten Signalen (oder im vereinfachten System unverarbeiteten Signalen) an eine Kommunikationslösung wie etwa Zoom oder Big-Blue-Button. In diesem Zusammenhang geht es unter anderem um die Analyse der Effekte von "virtual audio cables" zur Verbindung von Softwarekomponenten für die Signalverarbeitung und Signalübertragung.

Kontakt: Prof. Dr.-Ing. Gerald Enzner (, Raum W2-0-068) und Dr.-Ing. Aleksej Chinaev (, Raum W2-073)

(Stand: 19.01.2024)  | 
Zum Seitananfang scrollen Scroll to the top of the page