Warum Data Vault 2.0?
In diesem Blog-Artikel werden einige Funktionen besprochen, bei denen Data Vault 2.0 glänzen kann und warum Sie es verwenden sollten. Als Datenbankentwickler, -administrator oder -nutzer haben Sie wahrscheinlich schon von Data Vault gehört. Aber mit einer bestehenden Datenbanklösung im Hinterkopf stellen Sie sich vielleicht die Frage, warum Sie Data Vault in Ihrem Unternehmen einsetzen sollten Enterprise Data Warehouse.
Grund 1: Unterstützung mehrerer Quellsysteme und häufig wechselnder Beziehungen
Data Vault 2.0 bietet die meisten Vorteile, wenn Ihre Daten aus vielen Quellsystemen stammen oder ständig wechselnde Beziehungen aufweisen.
Data Vault 2.0 eignet sich gut für Systeme mit mehreren Quellen oder solchen, die ständig wechselnde Beziehungen haben.
Der Grund, warum es für diese Systeme gut funktioniert, ist seine Fähigkeit, das Hinzufügen von Attributen zu vereinfachen. Wenn eine Änderung an einem Quellsystem vorgenommen wird, muss diese Änderung nicht in allen Quellsystemen erscheinen. Ebenso können Sie die Anzahl der Stellen, an denen Änderungen vorgenommen werden, begrenzen, da Attribute getrennt von Strukturdaten in Satelliten gespeichert werden.
Außerdem ist es einfacher, neue und sich ändernde Beziehungen zu berücksichtigen, indem Sie eine Verknüpfung schließen und eine neue erstellen. Sie müssen die historischen Daten nicht ändern, um eine neue Beziehung zu berücksichtigen oder ein bestehendes Schema zu aktualisieren. Sie müssen nur die zukünftigen Änderungen berücksichtigen. Dies bringt enorme Flexibilität und Skalierbarkeit in Ihr Unternehmen data warehouse.
Grund 2: Einfaches Verfolgen und Prüfen Ihrer Daten mit Data Vault 2.0
In einer modernen Datenumgebung durchlaufen die Daten verschiedene Stationen. Um dennoch eine kontinuierliche Datenqualität zu erfüllenEs muss immer klar sein, woher die Daten stammen.
Abbildung 1: Datenreihenfolge
Angesichts der Notwendigkeit, Daten leicht nachverfolgen und prüfen zu können, hat Data Vault diese Aufgabe erleichtert. Dies geschieht, indem es von Haus aus die Prüfung ermöglicht, da Ladezeiten und Datensatzquellen für jede Zeile erforderlich sind. Außerdem werden alle historischen Änderungen als Satelliten aufgezeichnet, einschließlich der Ladezeit als Teil des Primärschlüssels.
Wenn ein Attribut aktualisiert wird, wird ein neuer Datensatz erstellt.
All diese Prüfungen ermöglichen es Ihnen, auf einfache Weise Überprüfbarkeit sowohl für regulatorische Zwecke als auch für die Datenverwaltung. Und weil Sie Ihre gesamte Historie speichern, Sie können von jedem beliebigen Zeitpunkt aus auf die Daten zugreifen.
Grund 3: Schnelleres Laden von Daten aus mehreren Quellsystemen mit Data Vault 2.0
Data Vault ermöglicht schnelleres Laden von Daten weil eine Reihe von Tabellen gleichzeitig und parallel geladen werden kann. Das Modell verringert die Abhängigkeiten zwischen den Tabellen während des Ladevorgangs und vereinfacht den Ingestion-Prozess, indem nur Inserts verwendet werden, die schneller geladen werden als Upserts oder Merges. Dies führt auch zu geringere Komplexität.
Schlussfolgerung
Das Data Vault 2.0 ist für die Integration von Daten aus mehreren Quellsystemen ausgelegt und kann in manchen Situationen zu viel leisten.
Zusammenfassend lässt sich sagen, dass Data Vault für kleine bis mittelgroße Analyseanforderungen mit einem kleinen Team von Architekten, Designern und Ingenieuren, die eine Lösung mit Daten aus einigen wenigen Systemen bereitstellen, möglicherweise nicht geeignet ist.
Wenn Sie jedoch ein großes Projekt mit vielen Quellsystemen haben, das zu einer enormen Herausforderung bei der Datenintegration führt, kann Data Vault einen enormen Mehrwert für das Projekt darstellen.
Updates und Support erhalten
Bitte senden Sie Anfragen und Funktionswünsche an [email protected].
Für Anfragen zu Data Vault-Schulungen und Schulungen vor Ort wenden Sie sich bitte an [email protected] oder registrieren Sie sich unter www.scalefree.com.
Zur Unterstützung bei der Erstellung von Visual Data Vault-Zeichnungen in Microsoft Visio wurde eine Schablone entwickelt, mit der Data Vault-Modelle gezeichnet werden können. Die Schablone ist erhältlich bei www.visualdatavault.com.