Das Projekt

Das Projekt

Das Projekt

Im Rahmen des Master-Programms an der Carl von Ossietzky Universität Oldenburg nimmt jeder Student einmal an einer Projektgruppe teil. Das Projekt dauert dabei genau ein Jahr und bildet einen vollständigen Entwicklungsprozess aus dem Bereich der Informatik ab.

Wir haben als eine der wenigen Projektgruppen einen realen Kunden: die Firma CEWE Stiftung & Co. KGaA. Jedoch sind uns zu Beginn des Projektes noch kein genaues Ziel bzw. keine klaren Anforderungen genannt worden. Unser grobes Ziel ist es, die Daten der CEWE Fotostationen mittels Apache Hadoop auswerten zu können.

Die CEWE Fotostationen, auch Digi Foto Maker (kurz: DFM) genannt, sind die Kiosk-Stationen von CEWE Stiftung & Co. KGaA, die beim Point-of-Sale des Handelspartners wie z.B. Müller Großhandels Ltd. & Co. KG aufgestellt werden. Über den DFM können direkt Fotoprodukte vor Ort ausgedruckt bzw. eine Bestellung aufgegeben werden, welche im Labor von CEWE Stiftung & Co. KGaA angefertigt. Die Bestellung wird an die Filiale verschickt, sodass die Produkte abgeholt werden können. Der direkte Ausdruck vor Ort wird OnSite-Finishing (kurz: OSF) genannt.

Während der Bedienung der Fotostation wird das Klickverhalten anonymisiert aufgezeichnet und in einer semi-strukturieren XML-Datei an CEWE Stiftung & Co. KGaA übertragen. Neben den Auftragsdaten sind in der XML-Datei auch Informationen über den DFM an sich festgehalten wie z.B. die Temperatur des Druckers.

CEWE Stiftung & Co. KGaA wünscht sich eine Möglichkeit der Auswertung dieser Daten, um u.a. „Near Time“ Analysen vornehmen zu können. Zudem soll ein Alarm-System geschaffen werden, um Ausfälle und Störzeiten der DFM frühzeitig zu erkennen. CEWE Stiftung & Co. KGaA erhofft sich auch durch eine detaillierte Analyse des Bedienverhaltens der Bestellsoftware, diese noch weiter verbessern zu können.

Um diese Ziele und Anforderungen erreichen zu können, müssen wir zunächst einmal in Erfahrung bringen, was genau Apache Hadoop eigentlich ist und welche Komponenten es hat. Wir müssen uns also detailliert damit auseinandersetzen und prüfen, ob es wirklich für die Anforderungen von CEWE Stiftung & Co. KGaA geeignet ist. Wenn wir uns in diese Thematik eingearbeitet haben, wollen wir ein Apache Hadoop System aufbauen und einrichten um anschließend mögliche Algorithmen zur Realisierung der Anforderungen zu entwickeln. Hierzu müssen wir dann auch den Aufbau der XML-Dateien verstehen. Um diese besser nachvollziehen zu können, werden wir uns intensiv mit den CEWE Fotostationen beschäftigen und eigene Testdaten passend zu unseren Anforderungen erstellen.

(Stand: 21.08.2020)