資料超市檢視結構
此主題描述資料超市檢視的內部標頭欄 (可透過 hdr__ 前置詞識別)。資料管道通常最後會來到資料超市,將資料去正規化為星狀結構描述。事實呈現方便的結構,以讓分析師使用維度模型化來取用。因此,理解標頭欄的角色可讓您產生更聚焦的報告,以透過下游應用程式分析和取用。
事實檢視
檢視名稱格式:<DATA_ASSET_SCHEMA>.[<PREFIX>]<FACT>
下列標頭欄已新增至檢視結構:
資料行 |
類型 |
描述 |
---|---|---|
hdr__deleted | 布林 |
指示是否已從事實資料表刪除記錄。 |
hdr_{dimension-name}_key_id | int64 |
參考類型 1 和類型 2 維度。事實檢視將在事實中包含每個維度的獨立欄。 範例: hdr__EMPLOYEES_key_id |
類型 1 維度檢視
檢視名稱格式:<DATA_ASSET_SCHEMA>.[<PREFIX>]<DIMENSION>
下列標頭欄已新增至檢視結構:
資料行 |
類型 |
描述 |
---|---|---|
hdr_{dimension-name}_key_id | int64 |
序列隨每筆記錄增量。 |
hdr__deleted | 布林 |
指示是否已從維度表刪除記錄。 |
類型 2 維度檢視
檢視名稱格式:<INTERNAL_SCHEMA>.[<PREFIX>]<DIMENSION>
下列標頭欄已新增至檢視結構:
資料行 |
類型 |
描述 |
---|---|---|
hdr_{dimension-name}_key_id |
int64 |
序列隨每筆記錄增量。 |
hdr__from_timestamp | 時間戳記 |
此記錄版本的 UTC 開始時間戳記。例如,欄可能會指示客戶開始居住於特定地址的日期。 此欄可讓您:
對於具有去正規化實體的類型 2 維度,此為來自儲存或轉換資料資產中已更新資料集的時間戳記。 |
hdr__to_timestamp | 時間戳記 |
記錄版本的 UTC 結束時間戳記。該欄用來界定指定記錄版本的日期範圍。例如,欄可能會指示客戶停止居住於特定地址的日期。 也請參閱以上 hdr_from_timestamp 欄的描述。 |
hdr__operation | varchar(1) |
完整載入操作:
變更處理操作 (使用變更表格):
比較和套用操作所產生的動作:
|
hdr__was_current_from_timestamp | 時間戳記 |
顯示上次更新套用至記錄時的 UTC 時間戳記。 此欄與 hdr__was_current_to_timestamp 欄可讓您依特定日期分析資料,僅知道您當時知道的內容。例如,假設您每天在凌晨 2:00 計算前一天的訂單總額。因此在 12 月 1 日,前一天的訂單總和是 $1,000,000。不過,在 12 月 2 日,插入的記錄顯示在 11 月 30 日,下單總額為 $500,000。因此 11 月 30 日的訂單額實際上是 $1,500,000!不過,若您根據 12 月 1 日凌晨 2:00 的當下內容產生 11 月 30 日的訂單總和報告,結果仍會是 $1,000,000。 |
hdr__was_current_to_timestamp | 時間戳記 |
以較新的記錄取代記錄時會填入此欄。這顯示處理記錄時的 UTC 時間戳記,因此不會晚於最新記錄。 也請參閱以上 hdr__was_current_from_timestamp 欄的描述。 |