Data Mart-Ansichtsstruktur
In diesem Thema werden die internen Kopfzeilen (am Präfix hdr__ zu erkennen) von Data Mart-Ansichten beschrieben. Aus Daten-Pipelines werden oft Data Marts erstellt, die Daten in Sternschemas denormalisieren. Fakten bieten eine praktische Struktur für Analysten, die dimensionale Modellierung verwenden. Wenn Sie die Rolle der Kopfzeilenspalten verstanden haben, können Sie somit zielgerichtetere Berichte für die Analyse und Nutzung durch nachgelagerte Anwendungen erstellen.
Faktenansicht
Ansichtsnamensformat: <DATA_ASSET_SCHEMA>.[<PREFIX>]<FACT>
Die folgenden Kopfzeilenspalten werden zur Ansichtsstruktur hinzugefügt.
Spalte |
Typ |
Beschreibung |
---|---|---|
hdr__deleted | Boolesch |
Gibt an, ob der Datensatz aus der Faktentabelle gelöscht wurde oder nicht. |
hdr_{dimension-name}_key_id | int64 |
Verweis auf Dimensionen des Typs 1 und 2. Die Faktansicht enthält eine getrennte Spalte für jede Dimension im Fakt. Beispiel: hdr__EMPLOYEES_key_id |
Ansicht für Dimension Typ 1
Ansichtsnamensformat: <DATA_ASSET_SCHEMA>.[<PREFIX>]<DIMENSION>
Die folgenden Kopfzeilenspalten werden zur Ansichtsstruktur hinzugefügt.
Spalte |
Typ |
Beschreibung |
---|---|---|
hdr_{dimension-name}_key_id | int64 |
Sequenz pro Datensatz erhöht. |
hdr__deleted | Boolesch |
Gibt an, ob der Datensatz aus der Dimensionstabelle gelöscht wurde oder nicht. |
Ansicht für Dimension Typ 2
Ansichtsnamensformat: <INTERNAL_SCHEMA>.[<PREFIX>]<DIMENSION>
Die folgenden Kopfzeilenspalten werden zur Ansichtsstruktur hinzugefügt.
Spalte |
Typ |
Beschreibung |
---|---|---|
hdr_{dimension-name}_key_id |
int64 |
Sequenz pro Datensatz erhöht. |
hdr__from_timestamp | Zeitstempel |
Der UTC-Startzeitstempel für diese Version des Datensatzes. Beispielsweise kann die Spalte das Datum angeben, seit dem ein Kunde an einer bestimmten Adresse wohnt. Diese Spalte ermöglicht Folgendes:
Für eine Dimension Typ 2 mit denormalisierten Entitäten ist dies der Zeitstempel des aktualisierten Datensatzes im Speicher- oder Umwandlungsdatenobjekt. |
hdr__to_timestamp | Zeitstempel |
Der UTC-Endzeitstempel der Datensatzversion. Die Spalte wird verwendet, um den Datumsbereich für eine bestimmte Datensatzversion zu beschränken. Beispielsweise kann die Spalte das Datum angeben, seit dem ein Kunde nicht mehr an einer bestimmten Adresse wohnt. Siehe auch die Beschreibung der Spalte hdr_from_timestamp oben. |
hdr__operation | varchar(1) |
Vorgänge für vollständiges Laden:
Änderungsverarbeitungsvorgänge (unter Verwendung von Änderungstabellen):
Aktionen, die sich aus Vergleichs- und Anwendungsvorgängen ergeben:
|
hdr__was_current_from_timestamp | Zeitstempel |
Zeigt den UTC-Zeitstempel, der angibt, wann die letzte Aktualisierung auf den Datensatz angewandt wurde. Mit dieser Spalte zusammen mit der Spalte hdr__was_current_from_timestamp können Sie Daten an einem bestimmten Datum nur mit dem Wissen zum betreffenden Zeitpunkt analysieren. Beispiel: Sie berechnen täglich um 2 Uhr morgens den Gesamtbetrag der Bestellungen des Vortags. Am 1. Dezember beträgt die Gesamtsumme der Bestellungen des Vortags 1.000.000 $. Am 2. Dezember wird jedoch ein Datensatz eingefügt, der besagt, dass am 30. November eine Bestellung über insgesamt 500.000 $ aufgegeben wurde. Also betrug der Bestellbetrag für den 30. November tatsächlich 1.500.000 $! Wenn Sie aber einen Bericht für die Gesamtsumme der Bestellungen am 30. November basierend auf den aktuellen Daten am 1. Dezember um 2 Uhr morgens erstellen, beläuft sich das Ergebnis immer noch auf 1.000.000 $. |
hdr__was_current_to_timestamp | Zeitstempel |
Diese Spalte wird ausgefüllt, wenn ein Datensatz durch einen neueren Datensatz ersetzt wird. Sie zeigt den UTC-Zeitstempel, an dem der Datensatz verarbeitet wurde und somit nicht mehr den neuesten Datensatz. Siehe auch die Beschreibung der Spalte hdr__was_current_from_timestamp oben. |