Theses

Informationsgewinnung aus Wikipedia: Zeiträume und Ereignisse

Bachelorarbeit in der Abteilung Softwaretechnik



Motivation

Wikipedia ist als Nachschlagewerk für Menschen lange etabliert. Die Extraktion von Informationen für die Verwendung durch Maschinen aus den menschenlesbaren Artikeln ist allerdings noch ein aktives Forschungsfeld. In dieser Arbeit sollen maschinenlesbare Informationen zu Zeiträumen und Ereignissen extrahiert werden.


Aufgabenstellung

Wikipedia-Artikel sind für Menschen geschrieben, was eine Informationsextraktion schwierig macht. Mögliche Ansätze sind spezielle Extraktionsalgorithmen, Methoden der natürlich Sprachverarbeitung (NLP), Methoden der Künstlichen Intelligenz, oder eine Kombination der Methoden.

Zeiträume und Ereignisse sollen mit ihren Basisdaten (Bezeichnung, Datum etc.) aus Wikipedia-Datensätzen im XML- bzw. Text-Format gewonnen werden.


Betreuer
Prof. Dr. Andreas Winter ()
Dr. Christian Schönberg ()


(Changed: 2021-04-30)