In einem vorheriger Blogeintraghaben wir die verschiedenen Aspekte einer Standarddokumentation für die Namensgebung erörtert - von der Groß- und Kleinschreibung bis hin zu der Überlegung, ob Präfixe oder Suffixe in Datenbankobjektnamen verwendet werden sollen.
In diesem Artikel werden wir weiterhin unsere Vorschläge für Namenskonventionen in einer data warehouse-Lösung vorstellen und Beispiele für Namensstandards geben, die sowohl von unserem Team als auch von unseren Kunden intern verwendet werden.
Ebenenschemata
Für die Namen von Ebenenschemata werden bevorzugt Präfixe verwendet.
Wie im letzten Blogbeitrag beschrieben, erhöht diese Konvention die Sichtbarkeit bei der Datenexploration innerhalb der Enterprise Data Warehouse für Entwickler und Geschäftsanwender, indem Schemata der gleichen data warehouse-Schicht zusammengefasst werden.
Nachfolgend finden Sie eine Liste gängiger Enterprise Data Warehouse-Schichten und unsere entsprechenden Empfehlungen zu Namenskonventionen:
Abbildung 1: Empfohlene Benennungskonventionen für gängige Enterprise Data Warehouse-Schichten
EDW/Datenspeichereinheiten
Wie im vorangegangenen Abschnitt erläutert, trennen wir das Raw Data Vault und das Business Vault nicht in verschiedene Datenbankschemata. Stattdessen können die Benutzer anhand des Entitätsnamens zwischen einer Raw Vault-Entität und einer berechneten Entität unterscheiden.
Nachfolgend finden Sie eine Liste von Namenskonventionen für Standard-Data Vault-Entitäten sowie für erweiterte Entitätstypen.
**Note: PIT and bridge tables are only available in Business Vault
Abbildung 2: Namenskonventionen für Standard-Data Vault-Entitäten
Mehr über Benennungskonventionen für Satelliteneinheiten
Die Kriterien für die Aufteilung von Satelliten spielen eine wichtige Rolle bei den Namenskonventionen für Satellitenstrukturen. Es wird nämlich nicht empfohlen, dass alle beschreibende Daten eines Geschäftsobjekts in einer einzigen Satellitenstruktur gespeichert werden - stattdessen sollten die Rohdaten vorzugsweise nach bestimmten Kriterien aufgeteilt werden. ( Linstedt, D., & Olschimke, M. (2016). Aufbau eines skalierbaren Data Warehouse mit Data Vault 2.0. P114-115)
Bei Scalefree haben wir drei Arten von Satelliten-Splits definiert:
- aufgeteilt nach Quellensystem
- technische Aufteilung nach Änderungsrate, Sicherheitsstufe und Datenschutzstufe
- und geschäftsorientierte Aufteilung
Ein Satellit, der von Quellsystem und die technische Aufteilung nach der Änderungsrate der Daten sind gängige und empfohlene Praktiken, wenn es um die Aufteilung beschreibender Attribute geht. Wir haben uns jedoch entschlossen, die Rohdaten noch weiter aufzuteilen, sowohl technisch als auch nach ihrer geschäftlichen Bedeutung.
Daher lautet unsere vollständige Namenskonvention für Satelliteneinheiten wie folgt:
[parent-obj]_[biz-split]_[src]_[tech-split]_[satellite-type-suffix]
Mit:
[parent-obj] = der Name des Geschäftsobjekts des übergeordneten Satelliten
[biz-split] = die Unternehmensklassifizierung,
[src] = eine Abkürzung für das Quellsystem und
[tech-split] = eine Kombination von technischen Kriterien für das Satellitensplitting.
Bitte beachten Sie, dass die durch verschiedene Sicherheitsstufen gekennzeichnete Aufteilung die Daten in Sicherheitsgruppen klassifiziert. So erhalten die Endnutzer nur Zugang zu bestimmten Tabellengruppen, die ihrer Sicherheitsstufe entsprechen.
Im Rahmen unseres Verfahrens reichen die Sicherheitsstufen von:
- die niedrigste Vertraulichkeitsstufe - Stufe 0, 1: keine Sicherheitsmaßnahmen erforderlich, für öffentliche Daten,
- begrenzter Zugang zu bestimmten internen Parteien - Ebene A, R, C, F.
- auf die höchste Vertraulichkeitsstufe - Stufe S: streng geheim.
Es ist wichtig zu beachten, dass das letzte technische Kriterium für die Aufteilung von Satelliten innerhalb der SOP der Scalefree durch die Aufteilung der Privatsphäre definiert ist. Diese Trennung ist ein notwendiger Bestandteil des Prozesses, da sie persönliche und nicht-persönliche Informationen voneinander trennt.
Im weiteren Verlauf verteilt der geschäftsorientierte Satellitensplit die Rohdaten in verschiedene Satellitentabellen, wobei bestimmte geschäftliche Bedeutungen des Dateninhalts verwendet werden.
Zu diesem Zweck haben wir mehrere Klassifikationen definiert, um nur einige zu nennen: "Kontakt" für Kontaktdaten und "Aktivität" für Daten, die die Interaktionen der Nutzer mit dem Quelldatensatz verfolgen.
Darüber hinaus können Datenmodellierer benutzerdefinierte Geschäftsklassifikationen für bestimmte eindeutige Geschäftsbedeutungen in Geschäftsobjekten definieren.
Zum Beispiel alle Datenattribute einer auf der CRM-Plattform installierten Anwendung Salesforce werden häufig in einer einzigen Satellitenstruktur gespeichert. Daher zielt die geschäftsorientierte Aufteilung der Satelliten darauf ab, die Benutzerfreundlichkeit und Zugänglichkeit des EDW für die Endbenutzer zu verbessern. Dies geschieht dadurch, dass die Benutzer die von ihnen benötigten Daten innerhalb des DWH schneller und einfacher finden können, indem sie die Daten in Gruppen einteilen, die für die Geschäftsbenutzer tatsächlich von Bedeutung sind.
Im Folgenden finden Sie ein Beispiel für einen Satellitennamen in unserer internen EDW-Lösung:
kunde_kontakt_sfdc_lcp_s
Das obige Objekt ist ein Satellit des Geschäftsobjekts Kunde und enthält die Kontaktinformationen der Kunden aus dem Quellsystem Salesforce. Sein Inhalt hat also eine niedrige Änderungsrate, eine Sicherheitsstufe von C und enthält personenbezogene Daten.
Zusammenfassung
In diesem Artikel haben wir unsere Empfehlungen bezüglich der Namenskonventionen für verschiedene Arten von data warehouse-Objekten vorgestellt und einen detaillierten Einblick in unsere Überlegungen zur Benennung von Satelliten gegeben.
Interessieren Sie sich für andere Aspekte des Namensstandards? Lassen Sie es uns im Kommentarbereich wissen!
- von Trung Ta
Updates und Support erhalten
Bitte senden Sie Anfragen und Funktionswünsche an [email protected].
Für Anfragen zu Data Vault-Schulungen und Schulungen vor Ort wenden Sie sich bitte an [email protected] oder registrieren Sie sich unter www.scalefree.com.
Um die Erstellung von Visual Data Vault-Zeichnungen in Microsoft Visio zu unterstützen, wurde eine Schablone implementiert, die zum Zeichnen von Data Vault-Modellen verwendet werden kann. Die Schablone ist erhältlich bei www.visualdatavault.com.
Newsletter
Jeden Monat neue Erkenntnisse über Data Vault