Mit der Einführung von Data Vault 2.0, das den Standard Data Vault 1.0 um Architektur- und Prozessdefinitionen erweitert, standardisierte Dan Linstedt die bei der Modellierung verwendeten Data Vault-Symbole. Auf der Grundlage dieser standardisierten Symbole wurde die Modellierungssprache Visual Data Vault (VDV) entwickelt, die von EDW-Architekten zur Erstellung von Data Vault-Modellen verwendet werden kann. Als unsere Gründer das Buch schrieben, benötigten sie einen visuellen Ansatz, um die Konzepte von Data Vault im Buch zu modellieren. Zu diesem Zweck entwickelten sie die grafische Modellierungssprache, die sich auf die logischen Aspekte von Data Vault konzentriert. Die Microsoft Visio-Schablonen und ein ausführliches Whitepaper sind verfügbar unter www.visualdatavault.com als kostenloser Download.
VERKNÜPFUNGEN IM VISUELLEN DATENTRESOR
Im Juni dieses Jahres haben wir einen weiteren Newsletter veröffentlicht, wie Hubs werden in der Buchhaltungsbranche modelliert. In diesem Newsletter erklären wir die Funktion von Standardverbindungen und wie die Modellierung im Bankensektor funktioniert.
Links verbinden einzelne Knotenpunkte in einem Data Vault-Modell und stellen entweder Transaktionen oder Beziehungen zwischen Geschäftsobjekten dar. Geschäftsobjekte sind im Geschäft miteinander verbunden. Kein Geschäftsobjekt ist vollständig von anderen Geschäftsobjekten getrennt. Stattdessen sind sie über die operativen Geschäftsprozesse miteinander verbunden, die Geschäftsobjekte bei der Ausführung ihrer Aufgaben verwenden. Die folgende Abbildung zeigt eine Verbindung, die zwei Hubs miteinander verbindet (eine Standardverbindung muss mindestens zwei Verbindungen haben).wie das folgende Diagramm zeigt:
Der Link in der obigen Abbildung verweist auf zwei Hubs: Konto und Kunde. Der Verbinder (der Pfeil) sollte als "(der Hub)" gelesen werden Kunde wird verwendet von (dem Link) Konto zum Kunden." Der zweite Verweis ist ein wenig anders, da der Name der Verbindung zwischen dem Account-Hub und dem Link durch die Bedeutung eines Kredit- oder Schuldkontos überschrieben wird. Dies ist in Fällen notwendig, in denen das Modell mehr Bedeutung erfordert oder wenn mehrere Verbindungen zum selben Hub erforderlich sind. Die Hash-Schlüssel eines jeden Hubs, die jedes Geschäftsobjekt durch ein berechnetes Attribut eindeutig identifizieren, werden in die Link-Entität repliziert, indem derselbe Attributname verwendet wird.
Eine Verknüpfung stellt eine Beziehung von vielen zu vielen dar und bietet daher Flexibilität, da Änderungen an den Geschäftsregeln kein Re-Engineering erfordern und die Granularität durch die Anzahl der referenzierten Knotenpunkte ausgedrückt wird und somit gut dokumentiert ist.
Die Verknüpfung enthält alle Hash-Schlüssel der verbundenen Hubs (logische Fremdschlüssel), ein Ladedatum, an dem die Beziehung zum ersten Mal in data warehouse ankommt, die Datensatzquelle, aus der die Daten stammen, und den Verknüpfungs-Hash-Schlüssel (logischer Primärschlüssel), der aus den Geschäftsschlüsseln der Hubs berechnet wird (nicht aus den Hash-Schlüsseln - niemals einen Hash!) und einem reinen Einfüge-Lademuster folgt.
Verknüpfungen verbessern die Flexibilität des Data Vault-Modells erheblich, da es einfach ist, Verknüpfungen hinzuzufügen oder den Beziehungstyp bestehender Verknüpfungen zu ändern. Es braucht weniger Zeit, um auf Änderungen im Unternehmen zu reagieren. Um neue Funktionen hinzuzufügen, müssen Sie nur neue Hubs hinzufügen und diese über Links mit bestehenden Hubs verbinden. Normalerweise wird ein Standardsatellit an die Verbindung angeschlossen, der die beschreibende Daten der Beziehung zwischen den Knotenpunkten.
Eine weitere häufige Art von Link ist der Non-Historized Link (auch bekannt als Transactional Link), der nur Transaktionen enthält und keinen Satelliten benötigt, was bedeutet, dass das Lademuster ein vollständiger Insert-Only-Ansatz ist. Lesen Sie mehr über den Wert von NH-Links in einem früherer Newsletter dieses Jahr.
Wie Sie Updates und Support erhalten
Bitte senden Sie Anfragen und Funktionswünsche an [email protected].
Für Anfragen zu Data Vault-Schulungen und Schulungen vor Ort wenden Sie sich bitte an [email protected] oder registrieren Sie sich unter www.scalefree.com.
Um die Erstellung von Visual Data Vault-Zeichnungen in Microsoft Visio zu unterstützen, wurde eine Schablone implementiert, die zum Zeichnen von Data Vault-Modellen verwendet werden kann. Die Schablone ist erhältlich bei www.visualdatavault.com.
Hallo, ich versuche, das Bild besser zu verstehen.
Dem Namen nach macht es Sinn, dass der Link einen Kunden nur mit einem Konto verbindet, mit dem er "interagiert" hat, da der Link selbst (oder die Erklärung) keine weiteren Informationen liefert.
Wenn ich mir das Modell und die explizite Angabe von "Kredit" und "Schuld" ansehe, frage ich mich, was der Nutzen / das Interesse dieser Notizen ist, da die Verknüpfung letztendlich eine einzige "Rolle" liefert und die Tatsache, dass ein Konto ein Kredit oder ein Debet ist (oder für eine Kredit- / Debetoperation verwendet wurde), im (eventuellen) Satelliten begraben ist.
In dem Fall, dass Sie eine Bewegung für einen Kunden von einem Konto (mit Soll-Rolle) zu einem anderen (mit Haben-Rolle) aufzeichnen möchten, würde die Verknüpfung wie folgt aussehen: LnkHKey, CustomerHKey, DebitAccHKey, CreditAccHKey, LD, RS.
Ich habe mich gefragt, wie würden Sie das visuell modellieren?
Würde er genauso aussehen wie dieser Beitrag oder wäre er anders?
Ich hätte das visuelle Modell mit zwei Verbindungen für den Fall der Verbindung mit zwei Rollen verwendet.
Wäre das nicht klarer?
BR, Roberto Zagni
Hallo Roberto,
Das gezeigte Modell ist ein logisches Modell und besagt, dass es sich bei dem mit dem Kunden verbundenen Konto um ein Kredit- oder ein Debetkonto handeln kann. Wie die Daten im Hintergrund aussehen, kann unterschiedlich sein. Die "Art" des Kontos könnte in einem beschreibenden Attribut enthalten sein (Teil des Satelliten auf dem Konto-Hub oder der Verknüpfung), wenn ein Konto entweder ein Kredit- oder ein Debitkonto sein kann, könnte durch einen zusätzlichen Bezeichner gesteuert werden, so dass die Verknüpfungsdaten um diesen Schlüssel erweitert werden müssen (oder der Satellit - der dann zu einem mehrfach aktiven Satelliten wird), könnte durch zwei verschiedene Schlüssel gesteuert werden (wie Sie beschrieben haben), oder jedes andere Szenario.
Bezogen auf Ihre Frage, würden Sie es auf die gleiche Weise modellieren. Es gibt immer noch nur einen Kunden, ein Konto, aber die Art der Beziehung kann unterschiedlich sein.
BR,
Marc Finger