Chair of Business Information Systems II







Analyse des aktuellen Standes der Technik im Bereich der automatisierten Erzeugung von Dokumentationen zu ETL-Prozessen

Um im gesamten Unternehmen anfallende Daten möglichst effizient und nutzbringend verwenden zu können, müssen diese bereinigt, vereinheitlicht und ggf. aggregiert werden. Prozesse, die Daten aus operativen Vorsystemen extrahieren und diese Daten nach gegebenen Anforderungen transformieren, werden als ETL-Prozesse (Extract Transform Load) bezeichnet. Dabei steigt die Komplexität dieser Prozesse mit der Komplexität der im Unternehmen eingesetzten Business Intelligence Systemen (BI-Systemen). Um Entwicklern und Fachanwendern zu unterstützen, bieten viele ETL-Prozessmodellierungstools die Möglichkeit, automatisierte ETL-Dokumentationen zu erzeugen. Es ist anhand verschiedener ETL-Prozessmodellierungstools zu untersuchen:

  • Welche Aspekte von ETL-Prozessen dokumentiert werden?
  • An wenn sich die Dokumentation richtet (Entwickler, Fachanwender, Beide, Weitere, …)
  • Ob sich die Dokumentation vorab konfigurieren lässt?
  • Die Benutzungsfreundlichkeit der Dokumentationserstellung.

Dabei ist zuerst zu untersuchen, ob die ETL-Prozessmodellierungstools über eine integrierte Dokumentationsfunktion verfügen und/oder ob es Dritt-Anbieter Tools gibt, die diese Funktion erfüllen.

Folgende ETL-Prozessmodellierungstools sind bei der Analyse zu berücksichtigen:

  • Microsoft SSIS
  • IBM DataStage
  • Pentaho Data Integrator
  • Talend

Zusätzlich ist zu überprüfen, ob Dritt-Anbieter Werkzeuge existieren, die herstellerunabhängig ETL-Prozesse dokumentieren können (Ein Bsp. könnte „Ascential MetaStage“ von IBM sein).

Quellen:

  • Gluchowski, P., Kurze, C., and Wunderlich, M. 2010. “Modellierung und Dokumentation von BI-Systemen,” CONTROLLING – Zeitschrift für erfolgsorientierte Unternehmensplanung (22), pp. 676-682.
  • Gluchowski, P., Hofmann, M., Kurze, C. and Jacobi, F. 2011. “Computer-Aided Warehouse Engi-neering: Dokumentation und Modellierung komplexer Data-Warehouse-Systeme”, 11th. TDWI Conference, München, 2011-06-07, in print.
  • Inmon, B. 1997. “The data warehouse budget,” DM Review Magazine, January.
  • Laudon, K. C., and Laudon, J. P. 2010. “MANAGEMENT INFORMATION SYSTEMS: MANAGING THE DIGITAL FIRM,” Upper Saddle River, New Jersey: Pearson.

Es ist selbstständig nach weiteren relevanten Quellen zu recherchieren!


20.10.2011