Optimierung der Datenhistorie in einem Business Intelligence-System
- Ziel dieser Arbeit ist es das nötige Wissen zur Sicherstellung einer korrekten Datenhistorie in einem Business Intelligence System zu liefern. Dabei wird vor allem auf das Phänomen von sich langsam verändernden Dimensionen (Slowly Changing Dimensions) eingegangen, das eine Optimierung der Datenhistorie darstellt. Der in der Wirtschaft nicht ganz eindeutige Begriff "Business Intelligence" wird nach [Kemper et al., 2006] als integrierter, unternehmensspezifischer IT-Gesamtansatz zur betrieblichen Entscheidungsunterstützung definiert. Dazu zählen im Einzelnen der ETL-Prozess, das Data Warehousing und das Online Analytic Processing. Weiterhin zählen dazu noch das Data Mining, das Reporting und die Präsentation (Dashboard und Portale). In Datenbanksysteme gibt es die Möglichkeit Slowly Changing Dimensions gezielt zu speichern. Dies geschieht im ETL-Prozess. Bevor die Daten in die Zieldatenbank geladen werden, werden sie speziell transformiert. Type 1 SCD stellt den einfach Fall des Updates dar. Der alte Wert wird lediglich mit dem neuen Wert überschrieben. Somit wird nur der aktuelle Stand eines DWH dargestellt. Type 3 SCD wird dagegen am seltensten verwendet. Hierbei wird eine weitere Spalte hinzugefügt, die den neuen Zustand anzeigt. In der alten spalte bleibt stets der originale Zustand gespeichert. Im Gegensatz zu Type 2 SCD kann hier nur der originale und der aktuelle Zustand angezeigt werden. Zwischenstände sind nicht möglich Diese Technik wird am seltensten verwendet ([Kimball et al., 2000]). Bei Type 2 SCD wird eine Historisierung durchgeführt. Dazu wird der alte Datensatz kopiert und mit der Änderung eingefügt. Zur eindeutigen Identifikation wird ein Ersatzschlüssel eingefügt. Der alte Schlüssel bleibt den Datensätzen als Attribut erhalten. Außerdem erhalten der alte und der neue Datensatz ein Start und Endedatum. So können beliebig viele Zustände über die Zeit gespeichert werden. Type 2 SDC ist die am häufigsten verwendete Methode. Weiterhin können zur Historisierung von Slowly Changing Dimensions Mischformen bzw. Erweiterungen dieser drei Arten verwendet werden.
- The aim of this thesis is to provide the information that is needed to build a correct data history in a Business Intelligence System. Thereby the phenomena of "Slowly Changing Dimensions" is emphasised. At first a definition of business intelligence is provided which includes the ETL-process, data warehousing, and on-line analytic processing. Furthermore data mining, reporting, dashboards an BI-portals can be considered as a part of the BI-process. It is possible to represent slowly changing dimensions in a database management system. This is modelled in the ETL-process. The data is transformed in a certain way, before being loaded into the data warehouse. Type 1 SCD represents a simple update of the current dimension entry. Type 2 SCD provides a history of the data. It saves all the intermediate states of it. Thus, a user can track all states that changed during a certain time. Type 2 SCD is the one which is mostly used. Type 3 SCD provides just the original and the actual state. Aside from this three types there are existing some hybrid and extended versions.
Author: | Waldemer Bergen |
---|---|
URN: | urn:nbn:de:kola-2549 |
Title Additional (English): | Optimizing the Data History in a Business Intelligence-System |
Referee: | Klaus G. Troitzsch |
Advisor: | Werner Gauer, Michael Möhring |
Document Type: | Bachelor Thesis |
Language: | German |
Date of completion: | 2008/10/16 |
Date of publication: | 2008/10/16 |
Publishing institution: | Universität Koblenz-Landau, Campus Koblenz, Universitätsbibliothek |
Granting institution: | Universität Koblenz, Fachbereich 4 |
Release Date: | 2008/10/16 |
Tag: | BI; Sich langsam verändernde Dimensionen; Slowly Changing Dimensions BI; Data Warhousing; Slowly Changing Dimensions |
GND Keyword: | Business Intelligence; Data-Warehouse-Konzept |
Number of pages: | v, 78 |
Institutes: | Fachbereich 4 / Institut für Wirtschafts- und Verwaltungsinformatik |
Dewey Decimal Classification: | 0 Informatik, Informationswissenschaft, allgemeine Werke / 00 Informatik, Wissen, Systeme / 004 Datenverarbeitung; Informatik |
Licence (German): | Es gilt das deutsche Urheberrecht: § 53 UrhG |