Lehrstuhl für Wirtschaftsinformatik II







Klassifikation und Modellierung von Anforderungen an die Performance von ETL-Prozessen

„Extract, Transform, Load” (ETL) ist ein Prozess, der Daten aus mehreren ggf. unterschiedlich strukturierten Datenquellen in einer Zieldatenbank vereinigt. Bekannt ist der Prozess vor allem durch seine Bedeutung beim Betrieb eines Data-Warehouses. Hier müssen große Datenmengen aus mehreren operationalen Datenbanken konsolidiert werden, um dann in dem Data Warehouse gespeichert zu werden.“ (Wikipedia)

Die Überführung von Daten aus Quellsystemen in ein Zielsystem erfordert unweigerlich den Einsatz von Ressourcen (Zeit und Arbeitsspeicher). Der Einsatz dieser Ressourcen wird üblicherweise sorgsam geplant, um das Kosten-Nutzen-Verhältnis zu optimieren. In diesem Zusammenhang werden die Anforderungen an ETL-Prozesse dermaßen gestellt, dass die gewünschten Ergebnisse (Bsp: minimales bzw. maximales Alter von aggregierten Daten im DWH) mit einem bestimmten, begrenzten Einsatz von Ressourcen (Bsp: minimaler Arbeitsspeicherbedarf; minimale Zeit von gesperrten Datenbanken beim Einsatz von pessimistischem Locking; minimale Behinderung der Arbeit mit einem System durch Ausführung der ETL-Prozesse während arbeitsfreier Nachtstunden) erreicht werden.

Folgende Fragen sollen beantwortet werden:

  • Welche Arten von Anforderungen gibt es? Was wird durch sie beabsichtigt? Welche Klassifikati-onen werden in der Literatur beschrieben?
  • Welche konkreten Instanzen von Anforderungen können gestellt werden?
  • Welche Möglichkeiten gibt es für jede Anforderung, ihr gerecht zu werden? Wie wird eine Ab-weichung ggf. behandelt?
  • Welche Methoden zur Spezifizierung gibt es? Wie kann das Ganze modelliert werden? (Beziehen Sie dabei auch Service Level Agreements mit ein, vgl. auch ITIL.)

Zielartefakte sind:

  • Klassifikation von Performancekriterien unter Einbeziehung existierender Klassifikationen. (Was wird gefordert?)
  • Konzeptionelles Modell zur Anforderungsbeschreibung/-erhebung unter Einbeziehung existie-render und thematisch benachbarter Modelle. (Wie wird es gefordert, in welcher Form?)

Quellen:

Es ist selbstständig nach weiteren relevanten Quellen zu recherchieren!