Für Anfänger kann es ein wenig überwältigend sein, mit der Data Vault 2.0und lernen, wie und wo man sie einsetzt. Es ist wichtig zu wissen, dass Data Vault 2.0 oft nur als Modellierungstechnik angesehen wird, aber es umfasst viel mehr als das. Nicht nur das, sondern es ist eine ganze BI-Lösung, die sich zusammensetzt aus agile Methodik, Architektur, Umsetzung und Modellierung.
Warum also Data Vault verwenden?
- Data Vault 2.0 ermöglicht es Ihnen, automatisierte Ladeprozesse/Muster zu erstellen und Modelle sehr einfach zu generieren
- Plattformunabhängigkeit
- Prüfbarkeit
- Skalierbarkeit
- Unterstützt ELT anstelle von ETL-Prozesse
Nachdem wir nun das Warum beantwortet haben, fragen Sie sich vielleicht, welche Schritte erforderlich sind, um Data Vault 2.0 in Ihrem Projekt zu implementieren?
Das hängt von vielen Faktoren ab, z. B. von Ihrem Geschäftsfall, der gewünschten Architektur, der Art und Weise, wie Ihre Quellen geladen werden, dem Zeitplan für Ihr Projekt usw.
Merkmal für Merkmal Architektur
Eines ist sicher: Die Architektur sollte vertikal und nicht horizontal aufgebaut sein. Das heißt, nicht Schicht für Schicht, sondern Merkmal für Merkmal.
Ein gängiger Ansatz ist hier der Tracer-Bullet-Ansatz. Auf der Grundlage des Geschäftswerts, der durch einen Bericht, ein Dashboard oder einen Information Mart definiert ist, müssen die Quelldaten identifiziert, modelliert und durch alle Schichten der Architektur geladen werden.
Nehmen wir zum Beispiel an, dass die Geschäftsanforderung darin besteht, ein Dashboard zu erstellen, um die Verkaufszahlen des Unternehmens zu analysieren:
1. Auszug
Als Erstes müssen wir die Daten aus den Quellsystemen extrahieren und die Daten so, wie sie sind, irgendwo laden. In diesem Beispiel haben wir die Daten in einen vorübergehenden Bereitstellungsbereich gelegt, aber Sie können auch einen dauerhaften Bereitstellungsbereich in einer Data Lake auch.
2. Transformieren
Als Nächstes sollten Sie, wenn nötig, einige harte Regeln anwenden. Seien Sie dabei vorsichtig, denn Sie wollen hier keine betriebswirtschaftlichen Berechnungen mit Hilfe eines Transformationswerkzeugs anstellen. Es gibt eine Menge verschiedener Lagerautomatisierung Werkzeuge, aus denen Sie wählen können: dbt, Koaleszieren, WhereScape, usw.
3. Laden Sie
Laden Sie Ihre Raw Stage in den Raw Vault.
4. Modell Geschäftsanforderungen
Modellieren Sie die Data Vault-Entitäten, die für die zu erfüllende Geschäftsanforderung benötigt werden. Wenn wir z.B. einige Verkaufstransaktionen und Kundendaten haben, modellieren wir eine Nicht-historisierter Linkauch Transactional Link genannt, und einen Customer Hub, sowie zusätzliche Satelliten zur Aufnahme der Kunden beschreibende Daten die wir am Ende im Sales Dashboard sehen wollen.
5. Geschäftslogik anwenden
Als Nächstes müssen wir einige Berechnungen und Aggregationen durchführen, also werden wir eine Geschäftslogik auf den Rohdaten aufbauen und sie in die business vault laden.
6. Einen Informationsmarkt aufbauen
Nun könnten wir die im Raw und Business Vault gespeicherten Daten direkt in Diagrammen/Dashboards verwenden, aber wir wollen die Daten so strukturieren, dass sie von den Geschäftsanwendern leicht gelesen und abgerufen werden können, also werden wir ein Informationsmarkt mit einem Sternschema-Modell mit einer Faktentabelle und Dimensionen.
7. Daten visualisieren
Um das Sales Dashboard in einem BI-Visualisierungstool wie PowerBI oder Tableau zu erstellen, holen wir uns jetzt direkt aus dem Sternschema im Information Mart, das alle Informationen enthält, die wir brauchen, und verwenden eine Verbindung zu meinem data warehouse in unserer Datenbank.
Data Vault 2.0 bietet einen agilen, skalierbaren und flexiblen Ansatz für Data Warehousing Automatisierung. Wie im Beispiel gezeigt, haben wir nur die Data Vault-Tabellen modelliert, die für die Erledigung der gestellten Aufgabe, ein Vertriebs-Dashboard zu erstellen, erforderlich waren. Auf diese Weise können Sie Ihr Unternehmen je nach Bedarf skalieren und müssen nicht das gesamte Unternehmen auf einmal abbilden.
Die Antwort auf die Frage, wie man Data Vault 2.0 einführt, lässt sich in einem einfachen Satz zusammenfassen: Konzentrieren Sie sich auf den Geschäftswert!
Wenn Sie eine Erklärung dieser schrittweisen Implementierung mit einer Demonstration tatsächlicher Daten unter Verwendung von dbt als gewähltem Transformationswerkzeug sehen möchten, sehen Sie sich die Webinar-Aufzeichnung.
- Barbara Schlottfeldt Maia (Scalefree)
Updates und Support erhalten
Bitte senden Sie Anfragen und Funktionswünsche an [email protected].
Für Anfragen zu Data Vault-Schulungen und Schulungen vor Ort wenden Sie sich bitte an [email protected] oder registrieren Sie sich unter www.scalefree.com.
Um die Erstellung von Visual Data Vault-Zeichnungen in Microsoft Visio zu unterstützen, wurde eine Schablone implementiert, die zum Zeichnen von Data Vault-Modellen verwendet werden kann. Die Schablone ist erhältlich bei www.visualdatavault.com.