Organisationsteam

Dr. Kyoko Sugisaki

Digitale Sprachwissenschaft (Institut für Niederländistik und Germanistik) 

Prof. Dr. Susanne Boll

Department für Informatik

Hannes Kath

Department für Informatik

Prof. Dr. Katrin Kleinschmidt-Schinke

Institut für Germanistik

Prof. Dr. Esther Ruigendijk

Institut für Niederländistik

Prof. Dr. Wolfram Wingerath

Department für Informatik

Fakultätsübergreifende Ringvorlesung: Computer, Mensch, Sprache

Interdisziplinäre Perspektiven an der Schnittstelle Sprachforschung/Informatik (WiSe 2022/2023)

Wir laden ganz herzlich zum Besuch einer hochaktuellen Ringvorlesung ein, die von Kolleg*innen der Institute für Germanistik/Niederlandistik und des Departments für Informatik fakultätsübergreifend organisiert wird. Sie ist lokalisiert an der Schnittstelle von Sprachwissenschaft/Korpuslinguistik und Informatik.

Es werden einerseits an dieser Schnittstelle arbeitende Expert*innen der UOL aus den Fakultäten II (Department für Informatik), III (Sprachwissenschaften) sowie VI (Medizin und Gesundheitswissenschaften) eingeladen.

Es werden andererseits Expert*innen (von Universitäten, des Fraunhofer IDMT, aus der Wirtschaft) aus den Bereichen Computerlinguistik, Digital Linguistics, Korpuslinguistik, automatische Spracherkennung, digitale Sprachverarbeitung, Human-Robot/Computer-Interaction mitwirken.

Die Vorlesung soll die Schlüsselkompetenzen der Studierenden im Bereich der digitalen Forschungsmethoden zur Sprach-Datenerhebung, -verarbeitung, und -analyse sowie im Bereich der Anwendungsperspektiven (in der Wissenschaft, aber auch im Bildungsbereich) stärken. Die Studierenden sollen somit einen interdisziplinären Einblick in Forschung und Anwendungsperspektiven zur Schnittstelle Sprachwissenschaft/Sprachtechnologie/Informatik erhalten und auch deren Chancen und Grenzen reflektieren können. Sie soll auch dazu beitragen, die unterschiedlichen beteiligten Disziplinen und Perspektiven stärker zu vernetzten. 

Die Veranstaltung ist im Professionalisierungsbereich lokalisiert und kann von Studierenden aller Fakultäten besucht werden. Im Bachelor ist sie den Modulen ipb331 und ipb332 (Schlüsselkompetenzen in Sprach- und Literaturwissenschaften und ihren Berufsfeldern) zugeordnet, im Master dem Modul ipb611 (Freies Modul). Die Studierenden finden die Veranstaltung unter der Veranstaltungsnummer 10.31.501 in Stud.IP.

In der Ringvorlesung sind auch interessierte Kolleg*innen der Universität willkommen sowie ebenso externe Gäste. 

Die Vorlesung Computer – Mensch – Sprache wird digital angeboten und findet montags von 14:15 Uhr bis 15:45 Uhr statt. Auf einen ca. 60-minütigen Vorlesungsvortrag folgt eine ca. 30-minütige Diskussion zum jeweiligen Themengebiet.

28. November 2022 (16:15 – 17:45)
Prof. Dr. Peter Birkholz
(Institut für Akustik und Sprachkommunikation, TU Dresden)

Artikulatorische Sprachsynthese mit VocalTractLab

Dieser Vortrag gibt eine Einführung in die artikulatorische Sprachsynthese mit einem Fokus auf das System VocalTractLab. Im Gegensatz zu den derzeit verbreiteten Verfahren der Verkettungssynthese oder der Sprachsynthese auf Basis neuronaler Vocoder verwendet die artikulatorische Synthese Modelle des Vokaltrakts, der Stimmlippen, der Aerodynamik und Akustik, sowie der Steuerung der Modellartikulatoren. Damit handelt es sich um eine Simulation des Spracherzeugungsprozesses mit einer hohen Flexibilität bezüglich der erzeugten Sprache. Im Vortrag werden die einzelnen Teilmodelle des Systems vorgestellt und erläutert, welche neuen Forschungsfragen sich aus der Simulation ergeben. Außerdem werden verschiedene Anwendungen der artikulatorischen Synthese vorgestellt.

Literaturtipps: Modeling Consonant-Vowel Coarticulation for Articulatory Speech Synthesis 

05. Dezember 2022
Dipl.-Ing. Hannes Kath
(Institut für Informatik, Universität Oldenburg)

Erstellung eines maschinell annotierten Sprachkorpus (CARInA); von der Abschlussarbeit in die Wissenschaft 

Dieser Vortrag stellt die Ergebnisse und den Prozess einer Diplomarbeit von der Themenfindung bis zur Publikation vor. Gegenstand der Abschlussarbeit war die Erstellung eines deutschen Sprachkorpus, welcher unter anderem für die Sprachsynthese genutzt werden kann und somit Annotationen auf unterschiedlichen Ebenen benötigt. Das Sprachmaterial des Korpus wurde der Plattform Wikipedia entnommen, die Annotationen mit unterschiedlichen Tools automatisch hinzugefügt. Typischer Anwendungsbereich gesprochener Korpora ist das Training neuronaler Modelle zur Spracherkennung, Personenerkennung, Sprachsynthese und Sprachanalyse. Die Erstellung hochwertiger handannotierter Korpora ist sowohl zeit- als auch kostenintensiv, wodurch für viele Anwendungen maschinell erstellte Korpora bevorzugt werden.

Literaturtipp: CARINA – A Corpus of Aligned German Read Speech Including Annotations

 

12. Dezember 2022
Dr. Thomas Schmidt
(MusicalBits GmbH)

Mündliche Korpora – Manuelle und automatisierte Herangehensweisen an Gespräche und gesprochene Sprache

Mündliche Korpora – also Audio- oder Videoaufnahmen natürlicher, spontaner Interaktion, die durch Transkription und Annotation für eine Analyse erschlossen werden – werden mindestens seit den 1950er Jahren von SprachwissenschaftlerInnen erhoben, um beispielsweise Variation (Dialekte) oder pragmatische Aspekte der verbalen Interaktion zu untersuchen. In vordigitaler Zeit bedeutete die Arbeit mit mündlichen Korpora das Hantieren mit Tonbändern, Schreibmaschinen und Zettelkästen. Heute existieren ausgereifte Workflows, die „digital geborene“ Aufnahmen in teilweise automatischen, teilweise durch digitale Tools unterstützten manuellen Vorgängen schrittweise um Informationen anreichern, um diese dann – wiederum durch digitale Werkzeuge unterstützt – für die Analyse nutzen oder web-basiert weitergeben zu können. Nichtsdestotrotz bleibt die Erhebung und Erschließung von und korpuslinguistische Arbeit mit gesprochener Sprache ein aufwändiges und komplexes Unterfangen.

In meinem Beitrag zur Ringvorlesung werde ich den Workflow vorstellen, der beim Aufbau des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) zur Anwendung kommt (Schmidt 2016). Anschließend diskutiere ich die Rolle, die maschinelle Methoden wie automatische Spracherkennung und andere Verfahren aus Computerlinguistik, Natural Language Processing oder „Künstlicher Intelligenz“ derzeit in der Arbeit mit mündlichen Korpora spielen und wie sie zukünftig zum Einsatz kommen können.

Literaturtipps: Construction and Dissemination of a Corpus of Spoken Interaction - Tools and Workflows in the FOLK project

19. Dezember 2022
Dr. Kyoko Sugisaki
(Digitale Sprachwissenschaft, Universität Oldenburg)

Zwischen Sprachtechnologie und Sprachwissenschaft: Erfahrungen aus Forschung und Lehre

09. Januar 2023
M.Sc. Jan Manemann
Dr. Daniel Schlitt
(worldiety GmbH Oldenburg)

AudioCAT – Kompetenzprüfung über sprachgesteuerte Computerdialogsysteme

16. Januar 2023

Titel wird noch bekannt gegeben

23. Januar 2023
Dr. rer. nat. Jens E. Appell & Laura Tuschen
(Fraunhofer-Institut für Digitale Medientechnologie IDMT)

Sprachtechnologien bei pathologischer Sprache

30. Januar 2023
Prof. Dr. Detmar Meurers
(Seminar für Sprachwissenschaft, Universität Tübingen)

Computerlinguistische Analyse sprachlicher Komplexität von Lese- und Lernertexten

Die Komplexität von Sprache ist aus unterschiedlichen Perspektiven
relevant: zur Analyse der Lesbarkeit von Texten oder zur
Charakterisierung der Sprachkompetenz von Individuen anhand ihrer
Sprachproduktion. In diesem Vortrag stellen wir einen empirisch
breiten, computerlinguistischen Ansatz zur automatischen Analyse von
sprachlicher Komplexität vor, der über eine Webapplikation
(http://ctapweb.com) auch allgemein nutzbar ist. Neben einführenden
Analysen diskutieren wir dann einige Faktoren, denen bisher weniger
Aufmerksamkeit geschenkt wurde: Wie wirken sich die Eigenschaften
einer Aufgabe auf die Komplexität des geschriebenen Textes aus? Was
passiert, wenn sprachliche Komplexität auf mathematische Komplexität
in Textaufgaben trifft?  Beeinflusst die sprachliche Komplexität eines
Lesetextes die Komplexität eines anschließend geschriebenen Textes?

Literaturtipps: 

Vergangene Vorträge

17. Oktober 2022
Prof. Dr. Wolfram Wingerath
(Institut für Informatik, Universität Oldenburg)

What You Say is What You Get – Handsfree Coding in 2022

Software zur Interpretation und Synthese natürlicher Sprache wird täglich von Millionen von Menschen genutzt, die smarte Heimassistenten verwenden oder einfach lieber auf ihrem Mobiltelefon diktieren als tippen. Doch während sich Schnittstellen zur freihändigen Bedienung bei den Verbrauchern längst durchgesetzt haben, werden sie von IT-Fachleuten meist noch als Spielerei betrachtet oder überhaupt nicht für den professionellen Einsatz in Betracht gezogen - völlig zu Unrecht!

In diesem Vortrag beschreibe ich ein Null-Kosten-Setup für freihändiges Programmieren, das extrem leistungsfähig und komfortabel in der Handhabung ist. Zunächst werde ich die Grundlagen der Steuerung des Computers und der Navigation in Anwendungen nur mit der Stimme (und den Augen und Mimik und mehr!) erläutern und über Best Practices und häufige Fallstricke berichten. Um den Lernprozess zu beschleunigen, werde ich in einer kurzen Coding-Session demonstrieren, wie man seine eigene Sprachbefehlsbibliothek per Sprachbefehl erweitern kann. Im Laufe des Vortrags werde ich meine persönlichen Erfahrungen teilen und erklären, wie ich mein eigenes Setup angepasst habe, um individuelle Arbeitsabläufe zu ermöglichen und zu optimieren. Am Ende des Vortrags werde ich darauf eingehen, wie ich Handsfree Coding bei meiner Arbeit einsetze wie man mit geringem Aufwand in das Thema einsteigen kann.

Literaturtipps: Sprechen ist das neue Klicken

24. Oktober 2022
Prof. Dr. Kerstin Fischer
(Department of Design and Communication, Social Design & Interaction Research, University of Southern Denmark)

Doing Linguistics Using Robots

Robots make excellent confederates in the experimental investigation of the meanings and functions of linguistic features, especially interactional and interpersonal effects, which are otherwise hard to identify empirically. This is because robots are controllable in ways humans are not and present exactly the same stimuli for all participants in identical ways, while at the same time being embodied and somewhat unknown interaction partners, which makes methodological constraints natural and acceptable.

In this talk, I present examples from several years of work in which I have used robots to study aspects of language and speech.

Literaturtipp: Studying Language Attitudes Using Robots

07. November 2022
Prof. Dr. Noah Bubenhofer
(Deutsches Seminar, Universität Zürich)

Die Sprache gibt es nicht. Das zeigt der Computer.

In der Linguistik werden seit geraumer Zeit umfangreiche Textsammlungen als sog. "Korpora" quantitativ und qualitativ ausgewertet, um Sprachgebrauch modellieren zu können. Damit verbunden ist die Prämisse, dass der Fokus der modernen Linguistik weniger auf der Idee von Sprache als System, sondern von Sprache als Sprachgebrauch in der Gesellschaft verstanden wird. Die statistische Analyse von großen Textkorpora bietet sich bei einer solchen Perspektive besonders an.

Welche Methoden werden nun angewandt, um solche Daten zu analysieren? Und welche Forschungsfragen lassen sich damit beantworten? Im Vortrag zeige ich Forschung aus verschiedenen Bereichen, z.B. zum Sprachgebrauch in der Corona-Pandemie. Deutlich wird dabei, dass es nicht sinnvoll ist anzunehmen, dass es "die Sprache" gibt und diese modellieren zu wollen, sondern dass es plausibler ist, unterschiedliche Sprachgebräuche zu modellieren und zu analysieren. Moderne Methoden der distributionellen Semantik (sog. Word Embeddings auf Basis von neuronalem Lernen) bieten sich hierzu an – allerdings nur dann, wenn damit auch ein entsprechendes theoretisches Verständnis verbunden ist.

Literaturtipps: Exploration semantischer Räume im Corona-Diskurs

14. November 2022
M.Sc. Stefan Gerd Fritsch
(Forschungsbereich Eingebettete Intelligenz, DFKI Kaiserslautern)

Natural Language Processing: How Do Computers Learn to "Understand" Natural Language? 

Künstliche neuronale Netze gehören heutzutage zu den wichtigsten Systemen, die zur maschinellen Verarbeitung natürlicher Sprache verwendet werden. Ob Sprachübersetzer, Spam-Filter, Sprachassistenten, Suchmaschinen oder automatische Rechtschreibprüfung - wir verwenden neuronale Netze tagtäglich, oftmals ohne es zu merken. Doch was sind künstliche neuronale Netze überhaupt? Wie funktioniert das Lernen von Daten? Wie können Computer ein "Verständnis" von Sprache entwickeln? Dieser Vortrag möchte diesen Fragen (und einigen weiteren) auf den Grund gehen. Hierzu werden wir neben den sogenannten feedforward neuronalen Netzen auch rekurrente Architekturen und deren Anwenungsmöglichkeiten zur Sprachverarbeitung kennenlernen. Darüber hinaus werden wir die neuesten Entwicklungen im Bereich der Transformer-basierten Sprachmodelle bis hin zu den größten Modellen mit mehreren Milliarden Parametern betrachten. Der Vortrag schließt mit einer kritischen Diskussion ethischer Fragestellungen und Problematiken, die der Einsatz von maschinellem Lernen zum Zwecke der Sprachverarbeitung mit sich bringt.

Literaturtipp: Five sources of bias in natural language processing.

21. November 2022
Prof. Dr. rer. nat. Jochem Rieger
(Angewandte Neurokognitive Psychologie, Universität Oldenburg)

Artificial and biological intelligence: How machine learning can advance our understanding of speech processing in the human brain

Literaturtipps: 

(Stand: 22.11.2022)