Zum Hauptinhalt springen
Suche
0
Scalefree - Blog - Data Vault - Granularität von Business Vault-Entitäten

Der Business Vault ist die Schicht in der Data Vault 2.0-Architektur, in der die Geschäftslogik zur Umwandlung, Bereinigung und Änderung der Daten implementiert ist.

Das Buch "Aufbau eines skalierbaren Data Warehouse mit Data Vault 2.0" von den Scalefree-Gründern Dan Linstedt und Michael Olschimke und dem Data Vault 2.0 Boot Camp zeigt, wie eine solche Geschäftslogik mit Hilfe verschiedener Business Vault-Entitäten, wie z. B. berechneten Satelliten, implementiert werden kann.

Es ist jedoch zu beachten, dass dies nur die halbe Geschichte, das halbe Wissen ist. Das Buch zeigt berechnete Satelliten (und andere Entitäten) mit einem Ladedatum im Primärschlüssel des berechneten Satelliten. Solche Satelliten eignen sich hervorragend für die Erfassung der Ergebnisse von Geschäftslogik, die auf die eingehenden Deltas angewendet wird. Es gibt jedoch zwei verschiedene Arten von Granularitäten für Geschäftslogik im Business Vault:

  1. In einigen Fällen wird die Geschäftslogik auf eingehende Deltas angewendet. Wenn z. B. Telefonnummern bereinigt werden sollen, wird die Datenbereinigungsregel in der Regel auf alle eingehenden Deltas angewendet, unabhängig davon, ob das Delta tatsächlich für die Informationsbereitstellung verwendet wird. Klingt seltsam, ist aber aufgrund der Möglichkeiten von SQL-Optimierern tatsächlich der effizientere Ansatz.
  2. In anderen Fällen stützt sich die Granularität der Geschäftslogik nicht auf die eingehenden Deltas, sondern auf die ausgehenden Informationen.

Die zweite Granularität lässt sich am besten anhand eines praktischen Beispiels beschreiben: Betrachten Sie die tägliche Berechnung des Lebenszeitwerts eines Kunden. Die Formel ist zeitabhängig, d. h. je mehr Zeit seit der letzten Bestellung vergangen ist, desto geringer ist der Lifetime Value, bis der Kunde eine neue Bestellung aufgibt.

In diesem Fall sinkt der Lifetime-Wert, obwohl keine neuen Daten im Raw Data Vault ankommen - es gibt also kein eingehendes Delta. Stattdessen sollte der Wert für jeden Kunden in regelmäßigen Abständen (z. B. täglich) berechnet werden. Und diese regelmäßige Basis entspricht der Granularität der in der Informationslieferung definierten Snapshots, die durch das Snapshot-Datum gekennzeichnet sind.

Zu diesem Zweck wird der berechnete Satellit geändert, indem das Ladedatum des Primärschlüssels durch das Datum des Schnappschusses ersetzt wird, was der Granularität der ausgehenden Informationen entspricht.

Aus Leistungsgründen wird der berechnete Satellit oft in Verbindung mit einer PIT-Tabelle verwendet. Es ist wichtig zu wissen, dass der Primärschlüssel solcher berechneten Satelliten mit dem Alternativschlüssel der PIT-Tabelle übereinstimmt, nämlich mit dem Hash-Schlüssel des übergeordneten PITs und das Datum des Schnappschusses. Der beschriebene informationsbasierte berechnete Satellit kann wiederum mit dem alternativen Schlüssel des PIT-Tabelle bei der Bereitstellung von Informationen.

Schlussfolgerung

Bei der Entwicklung des Business Vault gibt es fortgeschrittenere Techniken. Sie sind jedoch sehr hilfreich, wenn es darum geht, den Datenfluss vom Quellsystem in den für das Unternehmen zu erstellenden Informationsbestand zu gestalten.

Eine Antwort hinterlassen

Menü schließen