Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Data Mart-Ansichtsstruktur

In diesem Thema werden die internen Kopfzeilen (am Präfix hdr__ zu erkennen) von Data Mart-Ansichten beschrieben. Aus Daten-Pipelines werden oft Data Marts erstellt, die Daten in Sternschemas denormalisieren. Fakten bieten eine praktische Struktur für Analysten, die dimensionale Modellierung verwenden. Wenn Sie die Rolle der Kopfzeilenspalten verstanden haben, können Sie somit zielgerichtetere Berichte für die Analyse und Nutzung durch nachgelagerte Anwendungen erstellen.

Faktenansicht

Ansichtsnamensformat: <DATA_ASSET_SCHEMA>.[<PREFIX>]<FACT>

Die folgenden Kopfzeilenspalten werden zur Ansichtsstruktur hinzugefügt.

Tabellenkopfzeilenfelder

Spalte

Typ

Beschreibung

hdr__deleted Boolesch

Gibt an, ob der Datensatz aus der Faktentabelle gelöscht wurde oder nicht.

hdr_{dimension-name}_key_id int64

Verweis auf Dimensionen des Typs 1 und 2. Die Faktansicht enthält eine getrennte Spalte für jede Dimension im Fakt.

Beispiel:

hdr__EMPLOYEES_key_id

Ansicht für Dimension Typ 1

Ansichtsnamensformat: <DATA_ASSET_SCHEMA>.[<PREFIX>]<DIMENSION>

Die folgenden Kopfzeilenspalten werden zur Ansichtsstruktur hinzugefügt.

Tabellenkopfzeilenfelder

Spalte

Typ

Beschreibung

hdr_{dimension-name}_key_id int64

Sequenz pro Datensatz erhöht.

hdr__deleted Boolesch

Gibt an, ob der Datensatz aus der Dimensionstabelle gelöscht wurde oder nicht.

Ansicht für Dimension Typ 2

Ansichtsnamensformat: <INTERNAL_SCHEMA>.[<PREFIX>]<DIMENSION>

Die folgenden Kopfzeilenspalten werden zur Ansichtsstruktur hinzugefügt.

Tabellenkopfzeilenfelder

Spalte

Typ

Beschreibung

hdr_{dimension-name}_key_id

int64

Sequenz pro Datensatz erhöht.

hdr__from_timestamp Zeitstempel

Der UTC-Startzeitstempel für diese Version des Datensatzes. Beispielsweise kann die Spalte das Datum angeben, seit dem ein Kunde an einer bestimmten Adresse wohnt.

Diese Spalte ermöglicht Folgendes:

  • Daten basierend auf Verlaufsinformationen analysieren. Beispielsweise können Sie bestimmen, für wie lange sich eine Bestellung im ausstehenden Status befand oder wie sich die Änderung einer Kundenadresse auf den Umsatz im Vergleich zu den Daten des Vorjahres auswirkt.
  • Daten nach Datum mit dem jetzigen Wissen analysieren. Im Gegensatz hierzu können Sie mit dem unten beschriebenen hdr__was_current_from_timestamp die Daten an einem bestimmten Datum nur mit dem Wissen zum betreffenden Zeitpunkt analysieren.

Für eine Dimension Typ 2 mit denormalisierten Entitäten ist dies der Zeitstempel des aktualisierten Datensatzes im Speicher- oder Umwandlungsdatenobjekt.

hdr__to_timestamp Zeitstempel

Der UTC-Endzeitstempel der Datensatzversion. Die Spalte wird verwendet, um den Datumsbereich für eine bestimmte Datensatzversion zu beschränken. Beispielsweise kann die Spalte das Datum angeben, seit dem ein Kunde nicht mehr an einer bestimmten Adresse wohnt.

Siehe auch die Beschreibung der Spalte hdr_from_timestamp oben.

hdr__operation varchar(1)

Vorgänge für vollständiges Laden:

  • L: Während vollständigem Laden eingefügt

Änderungsverarbeitungsvorgänge (unter Verwendung von Änderungstabellen):

  • D: Gelöscht
  • U: Aktualisiert
  • I: Eingefügt.

Aktionen, die sich aus Vergleichs- und Anwendungsvorgängen ergeben:

  • d: Gelöscht
  • u: Aktualisiert
  • i: Eingefügt
hdr__was_current_from_timestamp Zeitstempel

Zeigt den UTC-Zeitstempel, der angibt, wann die letzte Aktualisierung auf den Datensatz angewandt wurde.

Mit dieser Spalte zusammen mit der Spalte hdr__was_current_from_timestamp können Sie Daten an einem bestimmten Datum nur mit dem Wissen zum betreffenden Zeitpunkt analysieren. Beispiel: Sie berechnen täglich um 2 Uhr morgens den Gesamtbetrag der Bestellungen des Vortags. Am 1. Dezember beträgt die Gesamtsumme der Bestellungen des Vortags 1.000.000 $. Am 2. Dezember wird jedoch ein Datensatz eingefügt, der besagt, dass am 30. November eine Bestellung über insgesamt 500.000 $ aufgegeben wurde. Also betrug der Bestellbetrag für den 30. November tatsächlich 1.500.000 $! Wenn Sie aber einen Bericht für die Gesamtsumme der Bestellungen am 30. November basierend auf den aktuellen Daten am 1. Dezember um 2 Uhr morgens erstellen, beläuft sich das Ergebnis immer noch auf 1.000.000 $.

hdr__was_current_to_timestamp Zeitstempel

Diese Spalte wird ausgefüllt, wenn ein Datensatz durch einen neueren Datensatz ersetzt wird. Sie zeigt den UTC-Zeitstempel, an dem der Datensatz verarbeitet wurde und somit nicht mehr den neuesten Datensatz.

Siehe auch die Beschreibung der Spalte hdr__was_current_from_timestamp oben.

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!