Seminar „Von Big Data zu Data Science: Moderne Methoden der Informationsverarbeitung“ (SS 2017)

Durch die stetig zunehmende Verbreitung und Leistungsfähigkeit moderner Informations- und Kommunikationstechnologien stehen uns mit ständig wachsender Geschwindigkeit mehr digitale Informationen und Daten zur Verfügung als je zuvor. Aus diesen gigantischen Datenmengen wichtige Informationen zuverlässig abzuleiten und leicht verständlich darzustellen, ist eine der zentralen Herausforderung der technologischen Moderne. Ein interdisziplinärer Ansatz zur Bewältigung dieser Aufgabe formiert sich unter dem Begriff „Data Science“. Der Ansatz vereint Herangehensweisen und Methoden aus den Bereichen Machine Learning, Mathematik, Schätztheorie, Visualisierung und Mustererkennung. Im Rahmen dieses Seminars sollen die in der Data Science verwendeten Konzepte und Methoden insbesondere im Kontext der Schätztheorie vorgestellt und an konkreten Anwendungsbeispielen dargestellt werden.

Das Seminar richtet sich an Diplom-Studierende Informatik ab dem 5. Semester, sowie an Master-Studierende Informatik und Bachelor-Studierende Informationswirtschaft.


Geforderte Leistungen

Für eine erfolgreiche Teilnahme müssen folgende Leistungen erbracht werden:

  • Vortrag von 15 Minuten mit anschließender Diskussion
  • Schriftliche Ausarbeitung (5 Seiten, mit LaTeX im 2-spaltigen Format)
  • Anwesenheit bei allen Veranstaltungen


Anrechenbarkeit

Im Diplomstudiengang Informatik wird für die erbrachte Leistung ein benoteter Seminarschein vergeben.

Im Masterstudiengang Informatik und Bachelorstudiengang Informationswirtschaft wird die erbrachte Leistung mit 3 LP angerechnet.


Einführungsveranstaltung

Bei dieser Veranstaltung wird der weitere Ablauf des Seminars vorgestellt und Hinweise für die Ausarbeitung sowie die Erstellung eines wissenschaftlichen Vortrags gegeben.

Die Einführungsveranstaltung findet am Mittwoch, den 26.04.2017, von 14:00 bis 15:30 im Raum 148, Geb. 50.20 Campusplan öffnen statt.

Zu diesem Termin müssen alle teilnehmenden Studierenden anwesend sein.


Abschlussveranstaltung

Der Termin für die Abschlussveranstaltung wird noch bekanntgegeben.


Ansprechpartner / Anmeldung

Es ist ab sofort möglich sich anzumelden.

Die Anmeldung folgt dem Prinzip "first-come, first-served". Zur Anmeldung bitte an Christof Chlebek eine E-Mail mit Name, Studiengang (sowie SPO 20xx), Matrikelnummer und Wunschthema (siehe unten).


Themenbeschreibungen

Zustandsschätzung auf zirkulären Mannigfaltigkeiten [vergeben]

Oft wird bei modernen Schätzverfahren pauschal eine lineare Topologie des Problems angenommen, auch wenn diese Annahme nicht zutreffend ist. Wahrscheinlichkeitsdichten auf periodische Mannigfaltigkeiten, die mittels einer zirkulären Topologie beschrieben werden können, verhalten sich jedoch anders und bedürfen einer besonderen Behandlung. In diesem Seminar sollen einfache Filter auf dem Kreis betrachtet werden, die, wie beim Kalman Filter im linearen Fall, eine Annahme über die auftretenden Dichten treffen.

  • Voraussetzung: Inhalte der Vorlesung Stochastische Informationsverarbeitung (SI)
  • Literatur:
    • Azmani, Monir, et al. "A recursive fusion filter for angular data." Robotics and Biomimetics (ROBIO), 2009 IEEE International Conference on. IEEE, 2009.
    • Kurz, Gerhard, Igor Gilitschenski, and Uwe D. Hanebeck. "Recursive nonlinear filtering for angular data based on circular distributions." 2013 American Control Conference. IEEE, 2013.


Extended Target Tracking Using Gaussian Processes [vergeben]

Neue Ansätze für das Tracking ausgedehnter Objekte erlauben die Verwendung von Gaußprozessen zur Beschreibung der Form des Objektes. Mithilfe derartiger Verfahren kann die Form des Objekts simultan zu dessen Pose geschätzt werden. In dieser Seminararbeit soll das Verfahren basierend auf Gaußprozessen mit einem älteren Verfahren basierend auf Fourierreihen verglichen werden, um die Vor- und Nachteile der beiden Ansätze zu identifizieren.

  • Literatur:
    • Wahlstrom, N., Özkan, E., "Extended Target Tracking Using Gaussian Processes", IEEE Transactions on Signal Processing, IEEE, 2015, 63, 4165-4178
    • Marcus Baum, Uwe D. Hanebeck, "Shape Tracking of Extended Objects and Group Targets with Star-Convex RHMs", Proceedings of the 14th International Conference on Information Fusion (Fusion 2011), Chicago, Illinois, USA, July 2011.


Rekursive Zustandsschätzung mittels iterativer statistischer Linearisierung [vergeben]

Um das Kalman Filter auf nichtlineare System anwenden zu können, müssen diese passend linearisiert werden. Z.B. linearisiert das Extended Kalman Filter (EKF) nichtlineare Abbildungen explizit um den Erwartungswert der prioren Schätzung. Dabei wird allerdings nicht die Unsicherheit der Schätzung berücksichtigt. Statistische Linearisierung, z.B. durchgeführt durch das Unscented Kalman Filter (UKF), beseitigt diesen Nachteil. Um die Zustandsschätzung weiter zu verbessern, kann die statistische Linearisierung auch noch iterativ angewendet werden. In diesem Seminar sollen Arbeitsweise und Vorteile der iterativen statistischen Linearisierung ausgearbeitet und präsentiert werden.

  • Literatur:
    • Ángel F. García-Fernández, Lennart Svensson, Mark R. Morelande, and Simo Särkkä, "Posterior Linearization Filter: Principles and Implementation Using Sigma Points", IEEE Transactions on Signal Processing, Vol. 63, No. 20, 2015
    • Ángel F. García-Fernández, Lennart Svensson and Mark R. Morelande "Iterated Statistical Linear Regression for Bayesian Updates", 17th International Conference on Information Fusion (FUSION), pages 1–8, July 2014


Filterung mit verschlüsselten Daten [vergeben]

In vielen Industriebereichen fallen durch die Verwendung "smarter" Sensoren zunehmend Daten an, die von Drittanbietern in der Cloud gespeichert, ausgewertet und überwacht werden sollen. Datensicherheit und Vertraulichkeit auf der einen Seite und ein serverseitiges Monitoring sowie Fehlerdetektion auf der anderen Seite sind konträre Anforderungen. Mittels moderner Ansätze kann jedoch eine Ende-zu-Ende-Verschlüsselung ermöglicht werden, die gleichzeitig Rechenoperationen auf den verschlüsselten Daten erlauben. In dieser Seminararbeit werden Ansätze zur Verarbeitung und Filterung verschlüsselter Sensordaten diskutiert.

  • Literatur:
    • R. Lagendijk, Z. Erkin und B. Mauro, "Encrypted Signal Processing for Privacy Protection: Conveying the Utility of Homomorphic Encryption and Multiparty Computation", IEEE Signal Processing Magazine, pp. 82 ‐ 105, 2012.
    • Francisco J. González-Serrano, Adrián Amor-Martı́n, Jorge Casamayón-Antón, "State estimation using an extended Kalman filter with privacy-protected observed inputs", 2014 IEEE International Workshop on Information Forensics and Security (WIFS), 2014.


Partially Observable Markov Decision Processes (POMDPs) [vergeben]

Viele moderne Anwendungen, wie beispielsweise hochautomatisiertes Fahren oder fliegende autonome Kameras , benötigen Algorithmen zur Regelung und Entscheidungsfindung auf Grundlage von verrauschten Sensordaten. Ein gängiges Vorgehen ist es ein stochastisches Model vom System zu nutzen und für jede getroffene Entscheidung das zukünftige Verhalten mitzuberücksichtigen. Die einkommenden Sensordaten werden dabei typischerweise nicht direkt in roher Form genutzt, sondern laufend zu einer Schätzung des Systemzustands fusioniert. Die Zustandsschätzung und das Model werden dann genutzt um ein Optimierungsproblem zu formulieren, wobei die Zielvorgabe durch eine Kosten- oder Gütefunktion gegeben ist. Dieses resultierende stochastische Optimierungsproblem muss dann noch gelöst werden, wobei eine berechenbare optimale Lösung nur für Spezialfälle gefunden werden kann. Ziel dieser Arbeit ist es sich in das oben beschriebene Problem einzuarbeiten, das grundlegende Verfahren zur Lösung von POMDPs auf Basis von sogenannten Alphavektoren auszuarbeiten und einen verständlichen Vortrag zu dem Thema zu halten.

  • Literatur:
    • Bertsekas, Dimitri P., et al. Dynamic programming and optimal control. Vol. 1. No. 2. Belmont, MA: Athena Scientific, 1995.
    • Matthijs T. J. Spaan, Partially Observable Markov Decision Processes. In Reinforcement Learning: State of the Art, pp. 387–414, Springer Verlag, 2012.


Meine Werkzeuge