Navigation

Skiplinks

Leitung:

Sekretariat:

Claudia Martsfeld

Öffnungszeiten Sekretariat:

Di/Do/Fr 9-15 h

Kontakt

Escherweg 2
26121 Oldenburg
Tel.: +49(0)441-9722-201
Fax: +49(0)441-9722-202

Studentische Abschlussarbeiten

Bachelorarbeiten

  • Twitter-Analysen für Echtzeit-Statistiken (Nowcasting) (Bachelor Thesis, Master Thesis)
    Für die Erhebung einiger Statistiken müssen aufwendige Telefonumfragen gemacht werden, deren Durchführung und Auswertung lange dauern. Ein Beispiel ist, dass Arbeitslosenstatistiken in den USA durch Telefonumfragen erhoben werden und somit erst verzögert zur Verfügung stehen. Jedoch ist es möglich, aus anderen, schneller zur Verfügung stehenden Datenquellen eine Abschätzung zu dem aktuellen Zustand zu geben, sogenanntes Nowcasting. Twitter ist eine beliebte Datenquelle (Google Trends eine weitere). So kann durch das Zählen der Häufigkeit bestimmter Begriffe die Entwicklung auf dem Arbeitsmarkt abgeschätzt werden. Zusätzlich kann dies mit einer Geo-Komponente versehen werden, sodass man die Häufigkeit bestimmter Begriffe in bestimmten Gebieten sehen kann und ggf. mit der Häufigkeit in der Vergangenheit vergleicht. In dieser Arbeit soll Odysseus genutzt werden, um den Twitter-Datenstrom für diesen Zweck zu untersuchen. Es soll möglich sein, die Trends bestimmter Begriffe, Kombiniertes Auftreten bestimmter Begriffe, etc. zu analysieren. Als Anwendungsbeispiel kann die Arbeitslosenquote genutzt werden oder auch ein oder mehrere eigene Beispiele eingebracht werden. Links - https://en.wikipedia.org/wiki/Nowcasting_(economics) - http://www.vldb.org/pvldb/vol10/p145-antenucci.pdf
  • Prio Reloaded (Bachelor Thesis)
    Priotitätsbasierte Verarbeitung bedeutet, dass bestimmte Anfragen oder bestimmte Elemente bevorzugt verarbeitet werden. In dieser Arbeit soll es darum gehen, Konzepte für die priorisierte Verarbeitung von Elementen wieder in Odysseus zu integrieren. Dafür liegen bereits eine Reihe von Konzepten aus der Disseration von Jonas Jacobi vor. Diese müssen in dieser Arbeit vor dem aktuellen Hintergrund von Odysseus analysiert und entsprechend angepassst realisiert werden.
  • Umgang mit großen Fenstern (Bachelor Thesis)
  • Debuggen von Stream-Anwendungen mit Odysseus (Bachelor Thesis)
    Datenstromverarbeitung erfolgt in der Regel durch die Aneinanderreihung von Operatoren. Ähnlich wie bei der Entwicklung in höheren Programmiersprachen können hier aber zur Laufzeit unerwartete Fehler auftreten. In dieser Arbeit soll ein Werkzeug entwickelt werden, welches ähnlich zu Debuggern in Programmiersprachen das Debuggen von Anfragen in Odysseus ermöglicht.
  • Evaluierung der Skalierbarkeit von OdysseusNet mit Apache Kafka (Bachelor Thesis)
    Zur Zeit geschieht die Kommunikation und vor allem auch der Datenstromtransfer zwischen verschiedenen Instanzen über eine eigens entwickelte NodeCommunication-Klasse (siehe http://odysseus.informatik.uni-oldenburg.de:8090/display/ODYSSEUS/Developing+with+OdysseusNet für einen schematischen Überblick). Da OdysseusNet modular aufgebaut ist, besteht die Möglichkeit die NodeCommunication-Klasse durch etwas anderes zu ersetzen um verschiedene Implementierungen für verschiedene Szenarien verfügbar zu haben und/oder sie mit einander zu vergleichen. Eine mögliche andere Implementierung könnte in diesem Zusammenhang sein, die Datenströme über ein Publish/Subscribe-System (konkret Apache Kafka, http://kafka.apache.org/) zu verteilen und zu überprüfen, in wie weit sich dadurch die Performanz, die Ausfallsicherheit und die Skalierbarkeit ändern.
  • Sprache für Apache Flink Anfragen in Odysseus (Bachelor Thesis)
    Apache Flink kommt Odysseus (im Vergleich zu anderen Systemen) relativ nah. Um uns aber besser mit Flink vergleichen zu können, wäre es interessant, Flink-Anfragen in Odysseus formulieren zu können. Beispiel: // Stream of (sensorId, carCnt) val vehicleCnts: DataStream[(Int, Int)] = ... val tumblingCnts: DataStream[(Int, Int)] = vehicleCnts // key stream by sensorId .keyBy(0) // tumbling time window of 1 minute length .timeWindow(Time.minutes(1)) // compute sum over carCnt .sum(1) val slidingCnts: DataStream[(Int, Int)] = vehicleCnts .keyBy(0) // sliding time window of 1 minute length and 30 secs trigger interval .timeWindow(Time.minutes(1), Time.seconds(30)) .sum(1) (Quelle: http://flink.apache.org/) Aspekte: - Punkt-Notation - Reihenfolge von Parametern - Zugriff auf Parameter über Index - Integration mit xText
  • Data Provenance in Streaming Systems (Bachelor Thesis, Master Thesis)
    Data Provenance meint den Ursprung eines Datums/Events. Es soll demnach möglich sein, in einem Datenstrommanagementsystem ein Ausgabedatum/-event bis hin zu den Eingabedaten/Events, die zu seiner Existenz beigetragen haben, zurückzuverfolgen. Dies ist vor allem für Diagnosen, Debugging aber auch für eine Transparenz gegenüber Nutzern wichtig. Ein Ansatz zu diesem Thema ist im Anhang beschrieben und soll in einer Bachelor- oder Masterarbeit für Odysseus umgesetzt werden, wobei sich eine Masterarbeit noch intensiver mit eigenen, anderen Ansätzen/Umsetzungsmöglichkeiten auseinander setzen sollte.

Masterarbeiten

  • Twitter-Analysen für Echtzeit-Statistiken (Nowcasting) (Bachelor Thesis, Master Thesis)
    Für die Erhebung einiger Statistiken müssen aufwendige Telefonumfragen gemacht werden, deren Durchführung und Auswertung lange dauern. Ein Beispiel ist, dass Arbeitslosenstatistiken in den USA durch Telefonumfragen erhoben werden und somit erst verzögert zur Verfügung stehen. Jedoch ist es möglich, aus anderen, schneller zur Verfügung stehenden Datenquellen eine Abschätzung zu dem aktuellen Zustand zu geben, sogenanntes Nowcasting. Twitter ist eine beliebte Datenquelle (Google Trends eine weitere). So kann durch das Zählen der Häufigkeit bestimmter Begriffe die Entwicklung auf dem Arbeitsmarkt abgeschätzt werden. Zusätzlich kann dies mit einer Geo-Komponente versehen werden, sodass man die Häufigkeit bestimmter Begriffe in bestimmten Gebieten sehen kann und ggf. mit der Häufigkeit in der Vergangenheit vergleicht. In dieser Arbeit soll Odysseus genutzt werden, um den Twitter-Datenstrom für diesen Zweck zu untersuchen. Es soll möglich sein, die Trends bestimmter Begriffe, Kombiniertes Auftreten bestimmter Begriffe, etc. zu analysieren. Als Anwendungsbeispiel kann die Arbeitslosenquote genutzt werden oder auch ein oder mehrere eigene Beispiele eingebracht werden. Links - https://en.wikipedia.org/wiki/Nowcasting_(economics) - http://www.vldb.org/pvldb/vol10/p145-antenucci.pdf
  • Data Provenance in Streaming Systems (Bachelor Thesis, Master Thesis)
    Data Provenance meint den Ursprung eines Datums/Events. Es soll demnach möglich sein, in einem Datenstrommanagementsystem ein Ausgabedatum/-event bis hin zu den Eingabedaten/Events, die zu seiner Existenz beigetragen haben, zurückzuverfolgen. Dies ist vor allem für Diagnosen, Debugging aber auch für eine Transparenz gegenüber Nutzern wichtig. Ein Ansatz zu diesem Thema ist im Anhang beschrieben und soll in einer Bachelor- oder Masterarbeit für Odysseus umgesetzt werden, wobei sich eine Masterarbeit noch intensiver mit eigenen, anderen Ansätzen/Umsetzungsmöglichkeiten auseinander setzen sollte.
Webmaster (Stand: 10.09.2018)