In der Data Vault 2.0-Architektur werden Information Marts verwendet, um den Endbenutzern Informationen zu liefern.
Konzeptionell entspricht ein Information Mart der gleichen Definition wie ein Data Mart in Legacy data warehousing. In der alten data warehousing wird ein Data Mart jedoch dazu verwendet, nützliche Informationen zu liefern, nicht Rohdaten. Aus diesem Grund wurde der Data Mart in Data Vault 2.0 umbenannt, um den Anwendungsfall besser widerzuspiegeln.
"Klassische" Informationssammlungen
Aber die Definition von Information Marts hat mehr Facetten. In dem Buch "Building a Scalable Data Warehouse with Data Vault 2.0" stellen wir drei Arten von Marts vor:
- Informationssammlungen: zur Bereitstellung von Informationen für Geschäftsanwender, in der Regel über Dashboards und Berichte.
- Metrics Mart: in Verbindung mit einem Metrics Vault verwendet, der Folgendes erfasst EDW ignorieren Protokolldaten in einem Data Vault-Modell. Der Metrics Mart wird aus dem Metrics Vault abgeleitet, um die Metriken zur Analyse von Leistungsengpässen oder des Ressourcenverbrauchs von Power-Usern und Data Scientists in verwalteten Self-Service-BI-Lösungen zu präsentieren.
- Fehler Mart: speichert diejenigen Datensätze, die beim Laden der Daten in das Unternehmen data warehouse typischerweise eine harte Regel nicht erfüllen.
Zusätzliche Informationssammlungen
Neben diesen "klassischen" Information Marts setzen wir in unserer Beratungspraxis weitere ein:
- Schnittstelle Mart: Dies ist mehr oder weniger ein Information Mart, allerdings werden die Informationen nicht an einen Menschen geliefert, z. B. über ein Dashboard oder einen Bericht. Stattdessen werden sie an eine nachfolgende Anwendung oder als Rückschreibung an das Quellsystem geliefert (z. B. bei Verwendung des Unternehmens data warehouse zur Datenbereinigung).
- Quality Mart: Der Quality Mart ist ebenfalls ein Information Mart, aber anstatt schlechte Daten zu bereinigen, wird er dazu verwendet, schlechte Daten zu melden. Im Wesentlichen wird die Geschäftslogik, die zur Bereinigung schlechter Daten verwendet wird, auf den Kopf gestellt: Dem Endbenutzer, dem Datenverwalter, werden nur schlechte Daten, manchmal auch unschöne Daten, geliefert. Dies geschieht häufig in Verbindung mit Datenbereinigungs-Frontends, in denen der Datenverwalter entweder die Quelldaten korrigieren oder die Ausnahmen kommentieren und kennzeichnen kann.
- Quelle Mart: wieder ein Information Mart, aber diesmal nicht mit einem der gängigen Schemata, wie Sternschemata, Schneeflockenschemata oder vollständig denormalisierten Schemata. Stattdessen verwendet der Information Mart das Datenmodell der Quellanwendung, ähnlich wie ein ODS-Schema (Operational Data Store). Der Source Mart ist jedoch keine Kopie der Daten, sondern ein virtualisiertes Modell, das auf dem Data Vault-Modell aufbaut und die ursprünglichen Strukturen widerspiegelt. Es eignet sich hervorragend für Ad-hoc-Berichte und ist für viele Datenwissenschaftler und Power-User von großem Wert.
Damit ist unsere Liste der Information Marts abgeschlossen. Wir haben sie erfolgreich in Projekten für unsere Kunden eingesetzt, um die tatsächliche Anwendung der Information Marts in deren Unternehmen besser zu vermitteln.
Lassen Sie es uns in den Kommentaren wissen, wenn Sie denken, dass dies auch für Sie hilfreich ist!
- Michael Olschimke (Scalefree)
Updates und Support erhalten
Bitte senden Sie Anfragen und Funktionswünsche an [email protected].
Für Anfragen zu Data Vault-Schulungen und Schulungen vor Ort wenden Sie sich bitte an [email protected] oder registrieren Sie sich unter www.scalefree.com.
Zur Unterstützung bei der Erstellung von Visual Data Vault-Zeichnungen in Microsoft Visio wurde eine Schablone entwickelt, mit der Data Vault-Modelle gezeichnet werden können. Die Schablone ist erhältlich bei www.visualdatavault.com.