Navigation

Skiplinks

Leitung:

Sekretariat:

Claudia Martsfeld

Öffnungszeiten Sekretariat:

Di/Do/Fr 9-15 h

Kontakt

Escherweg 2
26121 Oldenburg
Tel.: +49(0)441-9722-201
Fax: +49(0)441-9722-202

Studentische Abschlussarbeiten

Bachelorarbeiten

  • Twitter-Analysen für Echtzeit-Statistiken (Nowcasting) (Bachelor Thesis, Master Thesis)
    Für die Erhebung einiger Statistiken müssen aufwendige Telefonumfragen gemacht werden, deren Durchführung und Auswertung lange dauern. Ein Beispiel ist, dass Arbeitslosenstatistiken in den USA durch Telefonumfragen erhoben werden und somit erst verzögert zur Verfügung stehen. Jedoch ist es möglich, aus anderen, schneller zur Verfügung stehenden Datenquellen eine Abschätzung zu dem aktuellen Zustand zu geben, sogenanntes Nowcasting. Twitter ist eine beliebte Datenquelle (Google Trends eine weitere). So kann durch das Zählen der Häufigkeit bestimmter Begriffe die Entwicklung auf dem Arbeitsmarkt abgeschätzt werden. Zusätzlich kann dies mit einer Geo-Komponente versehen werden, sodass man die Häufigkeit bestimmter Begriffe in bestimmten Gebieten sehen kann und ggf. mit der Häufigkeit in der Vergangenheit vergleicht. In dieser Arbeit soll Odysseus genutzt werden, um den Twitter-Datenstrom für diesen Zweck zu untersuchen. Es soll möglich sein, die Trends bestimmter Begriffe, Kombiniertes Auftreten bestimmter Begriffe, etc. zu analysieren. Als Anwendungsbeispiel kann die Arbeitslosenquote genutzt werden oder auch ein oder mehrere eigene Beispiele eingebracht werden. Links - https://en.wikipedia.org/wiki/Nowcasting_(economics) - http://www.vldb.org/pvldb/vol10/p145-antenucci.pdf
  • Prio Reloaded (Bachelor Thesis)
    Priotitätsbasierte Verarbeitung bedeutet, dass bestimmte Anfragen oder bestimmte Elemente bevorzugt verarbeitet werden. In dieser Arbeit soll es darum gehen, Konzepte für die priorisierte Verarbeitung von Elementen wieder in Odysseus zu integrieren. Dafür liegen bereits eine Reihe von Konzepten aus der Disseration von Jonas Jacobi vor. Diese müssen in dieser Arbeit vor dem aktuellen Hintergrund von Odysseus analysiert und entsprechend angepassst realisiert werden.
  • Umgang mit großen Fenstern (Bachelor Thesis)
  • Debuggen von Stream-Anwendungen mit Odysseus (Bachelor Thesis)
    Datenstromverarbeitung erfolgt in der Regel durch die Aneinanderreihung von Operatoren. Ähnlich wie bei der Entwicklung in höheren Programmiersprachen können hier aber zur Laufzeit unerwartete Fehler auftreten. In dieser Arbeit soll ein Werkzeug entwickelt werden, welches ähnlich zu Debuggern in Programmiersprachen das Debuggen von Anfragen in Odysseus ermöglicht.
  • Evaluierung der Skalierbarkeit von OdysseusNet mit Apache Kafka (Bachelor Thesis)
    Zur Zeit geschieht die Kommunikation und vor allem auch der Datenstromtransfer zwischen verschiedenen Instanzen über eine eigens entwickelte NodeCommunication-Klasse (siehe http://odysseus.informatik.uni-oldenburg.de:8090/display/ODYSSEUS/Developing+with+OdysseusNet für einen schematischen Überblick). Da OdysseusNet modular aufgebaut ist, besteht die Möglichkeit die NodeCommunication-Klasse durch etwas anderes zu ersetzen um verschiedene Implementierungen für verschiedene Szenarien verfügbar zu haben und/oder sie mit einander zu vergleichen. Eine mögliche andere Implementierung könnte in diesem Zusammenhang sein, die Datenströme über ein Publish/Subscribe-System (konkret Apache Kafka, http://kafka.apache.org/) zu verteilen und zu überprüfen, in wie weit sich dadurch die Performanz, die Ausfallsicherheit und die Skalierbarkeit ändern.
  • Sprache für Apache Flink Anfragen in Odysseus (Bachelor Thesis)
    Apache Flink kommt Odysseus (im Vergleich zu anderen Systemen) relativ nah. Um uns aber besser mit Flink vergleichen zu können, wäre es interessant, Flink-Anfragen in Odysseus formulieren zu können. Beispiel: // Stream of (sensorId, carCnt) val vehicleCnts: DataStream[(Int, Int)] = ... val tumblingCnts: DataStream[(Int, Int)] = vehicleCnts // key stream by sensorId .keyBy(0) // tumbling time window of 1 minute length .timeWindow(Time.minutes(1)) // compute sum over carCnt .sum(1) val slidingCnts: DataStream[(Int, Int)] = vehicleCnts .keyBy(0) // sliding time window of 1 minute length and 30 secs trigger interval .timeWindow(Time.minutes(1), Time.seconds(30)) .sum(1) (Quelle: http://flink.apache.org/) Aspekte: - Punkt-Notation - Reihenfolge von Parametern - Zugriff auf Parameter über Index - Integration mit xText
  • Data Provenance in Streaming Systems (Bachelor Thesis, Master Thesis)
    Data Provenance meint den Ursprung eines Datums/Events. Es soll demnach möglich sein, in einem Datenstrommanagementsystem ein Ausgabedatum/-event bis hin zu den Eingabedaten/Events, die zu seiner Existenz beigetragen haben, zurückzuverfolgen. Dies ist vor allem für Diagnosen, Debugging aber auch für eine Transparenz gegenüber Nutzern wichtig. Ein Ansatz zu diesem Thema ist im Anhang beschrieben und soll in einer Bachelor- oder Masterarbeit für Odysseus umgesetzt werden, wobei sich eine Masterarbeit noch intensiver mit eigenen, anderen Ansätzen/Umsetzungsmöglichkeiten auseinander setzen sollte.

Masterarbeiten

  • Vergleichende Darstellung unterschiedlicher Lagebilder von Energienetzen (Master Thesis)
    Als State Estimation werden Verfahren bezeichnet, die auf Basis (meist redundanter) Messwerte aus einem Energienetz und einem angenommenen Netzmodell die komplexen Spannungen an jedem Knoten im Energienetz zu schätzen. Dieser komplexe Spannungsvektor wird als Netzzustand bezeichnet. Zusammen mit dem Netzmodell erhält man ein Lagebild. Der Adaptive State Estimators (ASE) der University of Queensland ist ein Verfahren um eine State Estimation nicht nur auf über-, sondern auch auf unterbestimmten Netzen durchzuführen (also auch auf Netzen, wo es keine redundanten Messwerte gibt). Für das Datenstrommanagementframework Odysseus gibt es eine Umsetzung des ASE, die auf Datenströmen arbeitet.  Durch die Digitalisierung der Energienetze und dem Entstehen von Smart Grids rücken aber koordinierte Cyberangriffe auf die Energienetze immer mehr in den Fokus, die nicht erkannt werden können. Dadurch kann es zu nicht vertrauenswürdigen Lagebildern kommen. Um die Operatoren bei der Bewertung der Lagebilder zu unterstützen, ist es erstrebenswert ihnen alternativer Lagebilder, basierend auf einer Simulation und/oder historischen Daten, zur Verfügung zu stellen. Im Rahmen dieser Masterarbeit soll eine vergleichende Darstellung unterschiedlicher Lagebilder konzipiert und als Webclient umgesetzt werden. Dabei soll es u.a. den menschlichen Operatoren ermöglicht werden, zwischen den einzelnen Lagebildern zu wechseln und sie auch gemeinsam darstellen zu lassen.
  • Erkennen von Anomalien in Energienetzen durch Klassifikation (Master Thesis)
    In dieser Masterarbeit soll eine Anomalieerkennung in Energienetzdaten mittels Klassifikation durchgeführt werden. Die Energienetzdaten können aus Zählerständen von Erzeugern und Verbrauchern auf Niederspannungsebene (Smart Meter in Haushalten und PV Anlagen) bestehen. Darüber hinaus kann es sich auch um Messdaten handeln, die ein Energienetzbetreiber von seinen Geräten im Mittelspannungsnetz (z.B. Transformator) erhält.  Die Energiedaten liegen in Form von Datenströmen vor und die Klassifikation soll in dem Datenstrommanagementframework Odysseus geschehen. Dabei können sowohl Verfahren, die ein Archiv historischer Daten benötigen, als auch inkrementelle Verfahren, die keine Speicherung aller vergangenen Daten benötigen, zum Einsatz kommen.  Es wird erwartet, dass mehrere vielversprechende Algorithmen umgesetzt und mit einander verglichen werden. Darüber hinaus muss für die Evaluation eine vorhandene Simulation von Energienetzdaten um Anomalien erweitert werden.
  • Erkennen von Anomalien in Energienetzen mit einer Zeitreihenvorhersage (Master Thesis)
    In dieser Masterarbeit soll eine Echtzeit-Zeitreihenvorhersage mit dem Ziel einer Anomalieerkennung in Energienetzdaten durchgeführt werden. Die Energienetzdaten können aus Zählerständen von Erzeugern und Verbrauchern auf Niederspannungsebene (Smart Meter in Haushalten und PV Anlagen) bestehen. Darüber hinaus kann es sich auch um Messdaten handeln, die ein Energienetzbetreiber von seinen Geräten im Mittelspannungsnetz (z.B. Transformator) erhält. Die Energiedaten liegen in Form von Datenströmen vor und die Zeitreihenanalyse soll in dem Datenstrommanagementframework Odysseus geschehen. Dabei können sowohl Verfahren, die ein Archiv historischer Daten benötigen, als auch inkrementelle Verfahren, die keine Speicherung aller vergangenen Daten benötigen, zum Einsatz kommen. Es wird erwartet, dass mehrere vielversprechende Algorithmen umgesetzt und mit einander verglichen werden. Darüber hinaus muss für die Evaluation eine vorhandene Simulation von Energienetzdaten um Anomalien erweitert werden.
  • Abnormal Traffic-indexed State Estimation mit dem Adaptive State Estimator in Odysseus (Master Thesis)
    Als State Estimation werden Verfahren bezeichnet, die auf Basis (meist redundanter) Messwerte aus einem Energienetz und einem angenommenen Netzmodell die komplexen Spannungen an jedem Knoten im Energienetz zu schätzen. Dieser komplexe Spannungsvektor wird als Netzzustand bezeichnet. Der Adaptive State Estimators (ASE) der University of Queensland ist ein Verfahren um eine State Estimation nicht nur auf über-, sondern auch auf unterbestimmten Netzen durchzuführen (also auch auf Netzen, wo es keine redundanten Messwerte gibt). Für das Datenstrommanagementframework Odysseus gibt es eine Umsetzung des ASE, die auf Datenströmen arbeitet. Traditionell werden auf Basis des geschätzten Netzzustands und der eingegangenen Messwerte durch eine sogenannte Bad Data Detection fehlerhafte Messwerte identifiziert und eliminiert. Durch die Digitalisierung der Energienetze und dem Entstehen von Smart Grids rücken aber koordinierte Cyberangriffe auf die Energienetze immer mehr in den Fokus, die durch traditionelle Bad Data Detection nicht erkannt werden können. Im Rahmen dieser Masterarbeit soll ein Verfahren von Ting Liu und seinen Kollegen von der Xi'an Jiaotong University mit dem ASE in Odysseus umgesetzt und erprobt werden. Es geht dabei darum Alarme eines Intrusion Detection Systems mit einem Gefährdungslevel zu gewichten und diese Informationen in die State Estimation einfließen zu lassen. Bei der State Estimation ist dann das Ziel, Messwerte von Geräten im Energienetz, für die es einen Alarm mit höherem Gefährdungslevel gab, weniger zu berücksichtigen.
  • Erkennen von Anomalien in Energienetzdaten mit neuronalen Netzen in Odysseus (Master Thesis)
    Das Datenstrommanagementframework Odysseus verfügt über ein Feature mit dem ein neuronales Netz auf einem Datenstrom trainiert und angewendet werden kann. In dieser Masterarbeit soll untersucht werden, wie mit diesem Feature eine Anomalieerkennung in Energienetzdaten durchgeführt werden kann. Die Energienetzdaten können aus Zählerständen von Erzeugern und Verbrauchern auf Niederspannungsebene (Smart Meter in Haushalten und PV Anlagen) bestehen. Darüber hinaus kann es sich auch um Messdaten handeln, die ein Energienetzbetreiber von seinen Geräten im Mittelspannungsnetz (z.B. Transformator) erhält. Zu dieser Untersuchung gehört vor allem auch die Evaluation aller für ein neuronales Netz relevanter Parameter um die Einstellung für eine bestmögliche Anomalieerkennung zu identifizieren. Außerdem muss für die Evaluation eine vorhandene Simulation von Energienetzdaten um Anomalien erweitert werden.
  • Twitter-Analysen für Echtzeit-Statistiken (Nowcasting) (Bachelor Thesis, Master Thesis)
    Für die Erhebung einiger Statistiken müssen aufwendige Telefonumfragen gemacht werden, deren Durchführung und Auswertung lange dauern. Ein Beispiel ist, dass Arbeitslosenstatistiken in den USA durch Telefonumfragen erhoben werden und somit erst verzögert zur Verfügung stehen. Jedoch ist es möglich, aus anderen, schneller zur Verfügung stehenden Datenquellen eine Abschätzung zu dem aktuellen Zustand zu geben, sogenanntes Nowcasting. Twitter ist eine beliebte Datenquelle (Google Trends eine weitere). So kann durch das Zählen der Häufigkeit bestimmter Begriffe die Entwicklung auf dem Arbeitsmarkt abgeschätzt werden. Zusätzlich kann dies mit einer Geo-Komponente versehen werden, sodass man die Häufigkeit bestimmter Begriffe in bestimmten Gebieten sehen kann und ggf. mit der Häufigkeit in der Vergangenheit vergleicht. In dieser Arbeit soll Odysseus genutzt werden, um den Twitter-Datenstrom für diesen Zweck zu untersuchen. Es soll möglich sein, die Trends bestimmter Begriffe, Kombiniertes Auftreten bestimmter Begriffe, etc. zu analysieren. Als Anwendungsbeispiel kann die Arbeitslosenquote genutzt werden oder auch ein oder mehrere eigene Beispiele eingebracht werden. Links - https://en.wikipedia.org/wiki/Nowcasting_(economics) - http://www.vldb.org/pvldb/vol10/p145-antenucci.pdf
  • Data Provenance in Streaming Systems (Bachelor Thesis, Master Thesis)
    Data Provenance meint den Ursprung eines Datums/Events. Es soll demnach möglich sein, in einem Datenstrommanagementsystem ein Ausgabedatum/-event bis hin zu den Eingabedaten/Events, die zu seiner Existenz beigetragen haben, zurückzuverfolgen. Dies ist vor allem für Diagnosen, Debugging aber auch für eine Transparenz gegenüber Nutzern wichtig. Ein Ansatz zu diesem Thema ist im Anhang beschrieben und soll in einer Bachelor- oder Masterarbeit für Odysseus umgesetzt werden, wobei sich eine Masterarbeit noch intensiver mit eigenen, anderen Ansätzen/Umsetzungsmöglichkeiten auseinander setzen sollte.
Webmaster (Stand: 10.09.2018)