Data Science
Kontakt
Leitung
Sekretariat
Anschrift
Data Science
Data Science
In der Arbeitsgruppe „Data Science“ beschäftigen wir uns mit skalierbaren Technologien zur Speicherung und Verarbeitung von Daten, durch die große Datenmengen handhabbar werden und mittels derer Wissen aus ihnen extrahiert werden kann. Unser Fokus liegt dabei auf Ansätzen zur kontinuierlichen Analyse und Visualisierung, insbesondere von Daten aus dem Web-Kontext.
Kernbereiche unserer Forschung sind:
- Continuous Web Analytics & Real-User Monitoring: technische Messung von Seitenladezeit im Web; Quantifizierung der Nutzerzufriedenheit; Zusammenhang zwischen technischer Web Performance und geschäftskritischen Metriken im E-Commerce; Erkennung von synthetischem Traffic (Bot Detection); Anomalieerkennung; Datenbereinigung; Duplikatenerkennung; Datenvisualisierung (Continuous Dashboarding); Schemadesign und -evolution
- Web Caching & Dynamic Data: Cache-Kohärenz in global verteilten Caching-Infrastrukturen; Bereitstellung von Konsistenzgarantien unter Verwendung von expirationsbasierten Caches; beschleunigte Auslieferung von dynamischen Inhalten im Web; effiziente Erkennung und Invalidierung von veralteten Cache-Einträgen
- NoSQL & Cloud Data Management: Entscheidungshilfen zur Wahl geeigneter Systeme auf Basis von konkreten Anwendungen bzw. Anforderungsprofilen; aktive Mechanismen (etwa Trigger, Change Notifications); Modellierung von 1:n- und n:m-Beziehungen in Systemen ohne Support für Joins; Konsolidierung von spezialisierten Datenmanagementsystemen hinter einer einheitlichen Schnittstelle; Anfragesprachen und ihre Ausdrucksmächtigkeit im Vergleich mit SQL; mandantenfähige Cloud-Services und deren Bereitstellung (insbesondere Backend- und Database-as-a-Service)
- Real-Time Databases & Database Benchmarking: Entwicklung des Echtzeitdatenbanksystems InvaliDB mit der Fähigkeit zur kontinuierlichen Aktualisierung von Anfrageergebnissen (vgl. Firebase, Meteor, RethinkDB); Interfaces zur Verarbeitung von Ergebnisänderungen (Mächtigkeit vs. Ease-of-Use); Messung von nicht-funktionalen Eigenschaften wie Skalierbarkeit und Fehlertoleranz; Quantifizierung von Data Staleness; Validierung von Benchmarks