Übersicht über existierende Ansätze zur grafischen Modellierung von ETL-Prozessen
ETL-Prozesse (Extract, Transform, Load; ETL) beschreiben den Ablauf, wie Datensätze aus Quellsystemen, geladen, bereinigt, transformiert und letztendlich in ein Zielsystem überführt werden können. Diese Prozesse sind im Allgemeinen sehr komplex und schwierig zu beschrieben. Um die Endanwender bei der Modellierung von ETL-Prozessen zu unterstützen, werden daher grafische Modellierungswerkzeuge angeboten. Die Darstellung der ETL-Prozesse erfolgt, in Abhängigkeit vom verwendeten Werkzeug, in unterschiedlichen Notationsformen. Rahmen dieser Seminararbeit soll untersucht werden:
- Welche Modelelemente – bspw. Aktivitäten und Entitäten – zur Modellierung notwendig sind.
- Welche grafischen Notationen derzeit von verschiedenen Werkzeugherstellern für die verschiedenen Modelelemente existieren.
- Tabellarische Gegenüberstellung der verschiedenen Notation für die Elemente.
Quellen:
- Panos Vassiliadis, Alkis Simitsis, Eftychia Baikousi. A Taxonomy of ETL Activities. In Proc. ACM 12th International Workshop on Data Warehousing and OLAP (DOLAP 2009 ), (in conjunction with CIKM 2009), Hong Kong, November 6, 2009. http://www.cs.uoi.gr/~pvassil/publications/2009_DOLAP_ETL/DOLAP_2009_ETL.pdf
- P. Vassiliadis, A. Simitsis, P. Georgantas, M. Terrovitis, S. Skiadopoulos. “A generic and customizable framework for the design of ETL scenarios. Information Systems”, vol. 30, no. 7, pp. 492-525, November 2005, Elsevier Science Ltd. http://dx.doi.org/10.1016/j.is.2004.11.002
- Microsoft SQL Server Integration Services (SSIS) zur Erstellung von ETL-Prozessen: http://en.wikipedia.org/wiki/SQL_Server_Integration_Services
- IBM Cognos DecisionStream: http://www-01.ibm.com/software/data/cognos/products/series7/decisionstream/
- Open Source Talend Open Studio http://www.talend.com/index.php
Es ist selbstständig nach weiteren relevanten Quellen zu recherchieren!















