Zum Hauptinhalt springen
Suche
0
Scalefree - Blog - Data Vault - Kurzanleitung für eine Data Vault 2.0-Implementierung

Data Vault 2.0 Implementation

Data Vault 2.0 is often assumed to be only a modeling technique, but it encompasses much more than that. Not only that, but it is a whole BI solution composed of agile Methodik, Architektur, Umsetzung und Modellierung.

Warum also Data Vault verwenden?

  • Data Vault 2.0 ermöglicht es Ihnen, automatisierte Ladeprozesse/Muster zu erstellen und Modelle sehr einfach zu generieren
  • Plattformunabhängigkeit
  • Prüfbarkeit 
  • Skalierbarkeit
  • Unterstützt ELT anstelle von ETL-Prozesse

Nachdem wir nun das Warum beantwortet haben, fragen Sie sich vielleicht, welche Schritte erforderlich sind, um Data Vault 2.0 in Ihrem Projekt zu implementieren? 

Das hängt von vielen Faktoren ab, z. B. von Ihrem Geschäftsfall, der gewünschten Architektur, der Art und Weise, wie Ihre Quellen geladen werden, dem Zeitplan für Ihr Projekt usw.

Begehung einer Data Vault 2.0-Implementierung

It can be a bit overwhelming for beginners to start using Data Vault 2.0 and how to and where to implement it. In this webinar a very basic guide will be provided showing the steps needed for making a Data Vault 2.0 implementation based on a business requirement from scratch. This will be done with a demonstrated example, and it starts from the gathering of some sample requirements to the finished delivered product.

Webinar Teil 1 ansehenWebinar Teil 2 ansehen

Data Vault 2.0 feature by feature architecture

Eines ist sicher: Die Architektur sollte vertikal und nicht horizontal aufgebaut sein. Das heißt, nicht Schicht für Schicht, sondern Merkmal für Merkmal. 

Ein gängiger Ansatz ist hier der Tracer-Bullet-Ansatz. Auf der Grundlage des Geschäftswerts, der durch einen Bericht, ein Dashboard oder einen Information Mart definiert ist, müssen die Quelldaten identifiziert, modelliert und durch alle Schichten der Architektur geladen werden. 

Nehmen wir zum Beispiel an, dass die Geschäftsanforderung darin besteht, ein Dashboard zu erstellen, um die Verkaufszahlen des Unternehmens zu analysieren:

1. Auszug

Als Erstes müssen wir die Daten aus den Quellsystemen extrahieren und die Daten so, wie sie sind, irgendwo laden. In diesem Beispiel haben wir die Daten in einen vorübergehenden Bereitstellungsbereich gelegt, aber Sie können auch einen dauerhaften Bereitstellungsbereich in einer Data Lake auch.

2. Transformieren

Als Nächstes sollten Sie, wenn nötig, einige harte Regeln anwenden. Seien Sie dabei vorsichtig, denn Sie wollen hier keine betriebswirtschaftlichen Berechnungen mit Hilfe eines Transformationswerkzeugs anstellen. Es gibt eine Menge verschiedener Data Warehouse-Automatisierung Werkzeuge, aus denen Sie wählen können: dbt, Koaleszieren, WhereScape , usw.

Data Vault 2.0 Architektur

3. Laden Sie

Laden Sie Ihre Raw Stage in den Raw Vault.

4. Modell Geschäftsanforderungen


Modellieren Sie die Data Vault-Entitäten, die für die zu erfüllende Geschäftsanforderung benötigt werden. Wenn wir z.B. einige Verkaufstransaktionen und Kundendaten haben, modellieren wir eine Nicht-historisierter Linkauch Transactional Link genannt, und einen Customer Hub, sowie zusätzliche Satelliten zur Aufnahme der Kunden beschreibenden Daten die wir am Ende im Sales Dashboard sehen wollen.

5. Geschäftslogik anwenden

Als Nächstes müssen wir einige Berechnungen und Aggregationen durchführen, also werden wir eine Geschäftslogik auf den Rohdaten aufbauen und sie in die business vault laden.

6. Einen Informationsmarkt aufbauen

Nun könnten wir die im Raw und Business Vault gespeicherten Daten direkt in Diagrammen/Dashboards verwenden, aber wir wollen die Daten so strukturieren, dass sie von den Geschäftsanwendern leicht gelesen und abgerufen werden können, also werden wir ein Informationsmarkt mit einem Sternschema-Modell mit einer Faktentabelle und Dimensionen.

7. Daten visualisieren

Um das Sales Dashboard in einem BI-Visualisierungstool wie PowerBI oder Tableau zu erstellen, holen wir uns jetzt direkt aus dem Sternschema im Information Mart, das alle Informationen enthält, die wir brauchen, und verwenden eine Verbindung zu meinem data warehouse in unserer Datenbank.

Data Vault 2.0 bietet einen agilen, skalierbaren und flexiblen Ansatz für Data Warehousing Automatisierung. Wie im Beispiel gezeigt, haben wir nur die Data Vault-Tabellen modelliert, die für die Erledigung der gestellten Aufgabe, ein Vertriebs-Dashboard zu erstellen, erforderlich waren. Auf diese Weise können Sie Ihr Unternehmen je nach Bedarf skalieren und müssen nicht das gesamte Unternehmen auf einmal abbilden. 

Die Antwort auf die Frage, wie man Data Vault 2.0 einführt, lässt sich in einem einfachen Satz zusammenfassen: Konzentrieren Sie sich auf den Geschäftswert!

Wenn Sie eine Erklärung dieser schrittweisen Implementierung mit einer Demonstration tatsächlicher Daten unter Verwendung von dbt als gewähltem Transformationswerkzeug sehen möchten, sehen Sie sich die Webinar-Aufzeichnung.

- Barbara Schlottfeldt Maia (Scalefree)

Updates und Support erhalten

Bitte senden Sie Anfragen und Funktionswünsche an [email protected]

Für Anfragen zu Data Vault-Schulungen und Schulungen vor Ort wenden Sie sich bitte an [email protected] oder registrieren Sie sich unter www.scalefree.com.

Zur Unterstützung bei der Erstellung von Visual Data Vault-Zeichnungen in Microsoft Visio wurde eine Schablone entwickelt, mit der Data Vault-Modelle gezeichnet werden können. Die Schablone ist erhältlich bei www.visualdatavault.com.

Scalefree

Eine Antwort hinterlassen

Menü schließen