Data Profiling mit Eclipse. Von den Grundlagen zum Prototypen

von: Björn Knebel

Diplomica Verlag GmbH, 2009

ISBN: 9783836621229 , 108 Seiten

Format: PDF, OL

Kopierschutz: frei

Windows PC,Mac OSX geeignet für alle DRM-fähigen eReader Apple iPad, Android Tablet PC's Online-Lesen für: Windows PC,Mac OSX,Linux

Preis: 43,00 EUR

Mehr zum Inhalt

Data Profiling mit Eclipse. Von den Grundlagen zum Prototypen


 

Der erste Teil des Buches hat zum Ziel, eine Einführung in die Datenqualitätsanalyse zu geben und die Materie Data Profiling fundiert zu erläutern. Die zweite Hälfte beschäftigt sich mit der Konzeption und prototypischen Implementierung eines Data-Profiling-Werkzeugs auf Grundlage des Eclipse Modeling Frameworks. Die zentrale funktionale Eigenschaft der Lösung soll ein generiertes grafisches Datenmodell sein, das den Ausgangspunkt für typische Data-Profiling-Funktionen bildet. Aber auch der Entwicklungsprozess soll innovativen Charakter haben. So wird das Domänenmodell der Anwendung mithilfe des Eclipse Modeling Frameworks entworfen und in Programmcode transformiert. Der Diagrameditor wird über das Graphical Modeling Framework von Eclipse modelliert und generiert. Die Data-Profiling-Methoden werden per deskriptiver Schnittstellenerweiterung eingebunden.Die Lösung, der eher technisch/methodisch orientierten Problemstellung, wird mit den theoretischen Grundlagen der Datenqualität, einer ökonomischen Betrachtung und den potentiellen Anwendungsgebieten eingeleitet. Data-Profiling bildet dann den Schwerpunkt des zweiten Kapitels. Nachdem die Definition aus diversen Literaturquellen hergeleitet ist, wird das Vorgehensmodell dargestellt und die einzelnen Analysemethoden beschrieben und systematisiert.Anschließend wird die Systemumgebung thematisiert. Das Kapitel ist in eine Beschreibung der Eclipse-Plattform, eine Darstellung des modellbasierten Entwicklungsansatzes mit Eclipse und eine Analyse des Eclipse Modeling Frameworks unterteilt. Als Inspirationsquelle für das Werkzeugkonzept wurde eine Evaluation existierender Data-Profiling-Tools vorgenommen. Die letzten beiden Kapitel beschäftigen sich mit dem Entwurf und der Implementierung des Data-Profiling-Tools. Dargestellt sind unter andrem die modellgetriebene Entwicklung des Diagrammeditors, die Komponentenarchitektur, Aspekte der Pluginentwicklung unter Eclipse und die Implementierung ausgewählter Data-Profiling-Analysemethoden.