Diplomarbeitsthema: Implementierung eines Interval OLAP Ansatzes

On-Line Analytical Processing (OLAP) ist eine Methode um Daten entlang unterschiedlichster Dimensionen zu analysieren. Eine typische OLAP Anfrage könnte zum Beispiel sein: „Wie hoch war der Absatz der Produktgruppe A in der Region B im Zeitraum T“, in der Absatzdaten entlang der drei Dimensionen Produkte, Region und Zeit analysiert werden. Die Daten zur Beantwortung solcher Anfragen stammen meist aus einem Data Warehouse. Beide Bereiche, OLAP und Data Warehousing, sind bereits seit Jahrzehnten in praktisch jedem größerem Unternehmen im Einsatz.

In der Forschung ist in den letzten Jahren unter anderem das Thema „Sequential OLAP“ stark vorangetrieben worden. Dabei werden Methoden und Verfahren erforscht, um Sequenzen in Data Warehousing Systemen zu analysieren. Eine solche Sequenz könnten zum Beispiel Patientendaten einese Hospitals sein: eine Patientin wird auf einer Abteilung A aufgenommen -> es folgt eine erste Diagnose -> die Patientin wird verlegt auf eine Abteilung B -> es folgen mehrere Untsuchungen und Behandlungen -> die Patientin wird entlassen. Für traditionelle OLAP Ansätze ist das einfach eine Menge von unabhängigen Daten. Sequential OLAP betrachtet einen solchen Datenstrom jedoch als eine Sequenz von Daten, was zusätzliche Abfragemöglichkeiten erlaubt.

Eine Erweiterung dieses Ansatzes, welcher an der Universität Klagenfurt entworfen wurde, ist die Analyse von Intervaldaten in einem „Interval OLAP“ System. Dabei spielt nicht nur eine Sequenz von Daten eine wichtige Rolle, sondern auch die sich daraus ergebenden Intervalle. Als einfaches Beispiel können hier die Daten eines „Intelligenten Gebäudes“ dienen. In einem solchen Gebäude werden unterschiedlichste Daten gesammelt: wann wird das Licht in einem Büro ein- bzw. ausgeschalten? Wann läuft die Heizung? Zur Beantwortung einer Frage wie „Wie lange ist in den Büros des Gebäudes A im Zeitraum A durchschnittlich das Licht an?“ braucht es zusätzliches Wissen über die Intervalle zwischen den einzelnen Ereignissen (Licht An, Licht Aus).

Die zu erstellende Diplomarbeit soll sich mit dem Entwurf und der Implementierung einer Abfragesprache für einen solchen Interval OLAP Ansatz beschäftigen. Dabei kann auf eine bereits existierende Abfragesprache (und deren Implementierung in PHP, PostgreSQL) im Bereich Sequential OLAP zurückgegriffen werden.

Kontakt: Christian Koncilia

Share
Tags »

Autor:
Datum: Montag, 24. Februar 2014 12:05
Trackback: Trackback-URL Themengebiet: DA_Information Systems, DA_ISYS, Diplomarbeit, Hall of Fame, Institut, ISYS

Feed zum Beitrag: RSS 2.0 Diesen Artikel kommentieren

Kommentar abgeben