Was bei der Namensgebung im Data Warehousing zu beachten ist

In einem vorheriger Blogeintraghaben wir die verschiedenen Aspekte einer Standarddokumentation für die Namensgebung erörtert - von der Groß- und Kleinschreibung bis hin zu der Überlegung, ob Präfixe oder Suffixe in Datenbankobjektnamen verwendet werden sollen.

In diesem Artikel werden wir weiterhin unsere Vorschläge für Namenskonventionen in einer data warehouse-Lösung vorstellen und Beispiele für Namensstandards geben, die sowohl von unserem Team als auch von unseren Kunden intern verwendet werden.

Ebenenschemata

Für die Namen von Ebenenschemata werden bevorzugt Präfixe verwendet.
Wie im letzten Blogbeitrag beschrieben, erhöht diese Konvention die Sichtbarkeit bei der Datenexploration innerhalb der Enterprise Data Warehouse für Entwickler und Geschäftsanwender, indem Schemata der gleichen data warehouse-Schicht zusammengefasst werden.
Nachfolgend finden Sie eine Liste gängiger Enterprise Data Warehouse-Schichten und unsere entsprechenden Empfehlungen zu Namenskonventionen:

Was bei der Namensgebung im Data Warehousing zu beachten ist - Teil 2

Abbildung 1: Empfohlene Benennungskonventionen für gängige Enterprise Data Warehouse-Schichten

EDW/Datenspeichereinheiten

Wie im vorangegangenen Abschnitt erläutert, trennen wir das Raw Data Vault und das Business Vault nicht in verschiedene Datenbankschemata. Stattdessen können die Benutzer anhand des Entitätsnamens zwischen einer Raw Vault-Entität und einer berechneten Entität unterscheiden.

Nachfolgend finden Sie eine Liste von Namenskonventionen für Standard-Data Vault-Entitäten sowie für erweiterte Entitätstypen.

**Hinweis: PIT- und Bridge-Tische sind nur im Business Vault verfügbar

Abbildung 2: Namenskonventionen für Standard-Data Vault-Entitäten

Mehr über Benennungskonventionen für Satelliteneinheiten

Die Kriterien für die Aufteilung von Satelliten spielen eine wichtige Rolle bei den Namenskonventionen für Satellitenstrukturen. Es wird nämlich nicht empfohlen, dass alle beschreibende Daten eines Geschäftsobjekts in einer einzigen Satellitenstruktur gespeichert werden - stattdessen sollten die Rohdaten vorzugsweise nach bestimmten Kriterien aufgeteilt werden. ( Linstedt, D., & Olschimke, M. (2016). Aufbau eines skalierbaren Data Warehouse mit Data Vault 2.0. P114-115)

Bei Scalefree haben wir drei Arten von Satelliten-Splits definiert:

aufgeteilt nach Quellensystem
technische Aufteilung nach Änderungsrate, Sicherheitsstufe und Datenschutzstufe
und geschäftsorientierte Aufteilung

Ein Satellit, der von Quellsystem und die technische Aufteilung nach der Änderungsrate der Daten sind gängige und empfohlene Praktiken, wenn es um die Aufteilung beschreibender Attribute geht. Wir haben uns jedoch entschlossen, die Rohdaten noch weiter aufzuteilen, sowohl technisch als auch nach ihrer geschäftlichen Bedeutung.
Daher lautet unsere vollständige Namenskonvention für Satelliteneinheiten wie folgt:

[parent-obj]_[biz-split]_[src]_[tech-split]_[satellite-type-suffix]

Mit:

[parent-obj] = der Name des Geschäftsobjekts des übergeordneten Satelliten

[biz-split] = die Unternehmensklassifizierung,

[src] = eine Abkürzung für das Quellsystem und

[tech-split] = eine Kombination von technischen Kriterien für das Satellitensplitting.

Bitte beachten Sie, dass die durch verschiedene Sicherheitsstufen gekennzeichnete Aufteilung die Daten in Sicherheitsgruppen klassifiziert. So erhalten die Endnutzer nur Zugang zu bestimmten Tabellengruppen, die ihrer Sicherheitsstufe entsprechen.
Im Rahmen unseres Verfahrens reichen die Sicherheitsstufen von:

die niedrigste Vertraulichkeitsstufe - Stufe 0, 1: keine Sicherheitsmaßnahmen erforderlich, für öffentliche Daten,
begrenzter Zugang zu bestimmten internen Parteien - Ebene A, R, C, F.
auf die höchste Vertraulichkeitsstufe - Stufe S: streng geheim.

Es ist wichtig zu beachten, dass das letzte technische Kriterium für die Aufteilung von Satelliten innerhalb der SOP der Scalefree durch die Aufteilung der Privatsphäre definiert ist. Diese Trennung ist ein notwendiger Bestandteil des Prozesses, da sie persönliche und nicht-persönliche Informationen voneinander trennt.

Im weiteren Verlauf verteilt der geschäftsorientierte Satellitensplit die Rohdaten in verschiedene Satellitentabellen, wobei bestimmte geschäftliche Bedeutungen des Dateninhalts verwendet werden.
Zu diesem Zweck haben wir mehrere Klassifikationen definiert, um nur einige zu nennen: "Kontakt" für Kontaktdaten und "Aktivität" für Daten, die die Interaktionen der Nutzer mit dem Quelldatensatz verfolgen.
Darüber hinaus können Datenmodellierer benutzerdefinierte Geschäftsklassifikationen für bestimmte eindeutige Geschäftsbedeutungen in Geschäftsobjekten definieren.
Zum Beispiel alle Datenattribute einer auf der CRM-Plattform installierten Anwendung Salesforce werden häufig in einer einzigen Satellitenstruktur gespeichert. Daher zielt die geschäftsorientierte Aufteilung der Satelliten darauf ab, die Benutzerfreundlichkeit und Zugänglichkeit des EDW für die Endbenutzer zu verbessern. Dies geschieht dadurch, dass die Benutzer die von ihnen benötigten Daten innerhalb des DWH schneller und einfacher finden können, indem sie die Daten in Gruppen einteilen, die für die Geschäftsbenutzer tatsächlich von Bedeutung sind.

Im Folgenden finden Sie ein Beispiel für einen Satellitennamen in unserer internen EDW-Lösung:

kunde_kontakt_sfdc_lcp_s

Das obige Objekt ist ein Satellit des Geschäftsobjekts Kunde und enthält die Kontaktinformationen der Kunden aus dem Quellsystem Salesforce. Sein Inhalt hat also eine niedrige Änderungsrate, eine Sicherheitsstufe von C und enthält personenbezogene Daten.

Zusammenfassung

In diesem Artikel haben wir unsere Empfehlungen bezüglich der Namenskonventionen für verschiedene Arten von data warehouse-Objekten vorgestellt und einen detaillierten Einblick in unsere Überlegungen zur Benennung von Satelliten gegeben.

Interessieren Sie sich für andere Aspekte des Namensstandards? Lassen Sie es uns im Kommentarbereich wissen!

- von Trung Ta

Updates und Support erhalten

Bitte senden Sie Anfragen und Funktionswünsche an [email protected].

Für Anfragen zu Data Vault-Schulungen und Schulungen vor Ort wenden Sie sich bitte an [email protected] oder registrieren Sie sich unter www.scalefree.com.

Um die Erstellung von Visual Data Vault-Zeichnungen in Microsoft Visio zu unterstützen, wurde eine Schablone implementiert, die zum Zeichnen von Data Vault-Modellen verwendet werden kann. Die Schablone ist erhältlich bei www.visualdatavault.com.

Jeden Monat neue Erkenntnisse über Data Vault

Anmeldung zum Newsletter

Was bei der Namensgebung im Data Warehousing zu beachten ist - Teil 2

Ebenenschemata

EDW/Datenspeichereinheiten

Mehr über Benennungskonventionen für Satelliteneinheiten

Zusammenfassung

Updates und Support erhalten

Newsletter

Abonnieren Sie unseren kostenlosen monatlichen Newsletter

Eine Antwort hinterlassen Antwort abbrechen

Abonnieren Sie unseren kostenlosen monatlichen Newsletter

LÖSUNGEN

AUSBILDUNG

VERANSTALTUNGEN

KNOWLEDGE HUB

KARRIERE

UNTERNEHMEN

Was bei der Namensgebung im Data Warehousing zu beachten ist - Teil 2

Ebenenschemata

EDW/Datenspeichereinheiten

Mehr über Benennungskonventionen für Satelliteneinheiten

Zusammenfassung

Updates und Support erhalten

Newsletter

Abonnieren Sie unseren kostenlosen monatlichen Newsletter

Das könnte Ihnen auch gefallen

Rückschreibungen in der Enterprise Data Warehouse-Architektur

Hash Keys im Data Vault

Erfassung semistrukturierter beschreibender Daten

Eine Antwort hinterlassen Antwort abbrechen

Abonnieren Sie unseren kostenlosen monatlichen Newsletter

LÖSUNGEN

AUSBILDUNG

VERANSTALTUNGEN

KNOWLEDGE HUB

KARRIERE

UNTERNEHMEN