跳到主要內容 跳至補充內容

資料超市檢視結構

此主題描述資料超市檢視的內部標頭欄 (可透過 hdr__ 前置詞識別)。資料管道通常最後會來到資料超市,將資料去正規化為星狀結構描述。事實呈現方便的結構,以讓分析師使用維度模型化來取用。因此,理解標頭欄的角色可讓您產生更聚焦的報告,以透過下游應用程式分析和取用。

事實檢視

檢視名稱格式:<DATA_ASSET_SCHEMA>.[<PREFIX>]<FACT>

下列標頭欄已新增至檢視結構:

表格標頭欄位

資料行

類型

描述

hdr__deleted 布林

指示是否已從事實資料表刪除記錄。

hdr_{dimension-name}_key_id int64

參考類型 1 和類型 2 維度。事實檢視將在事實中包含每個維度的獨立欄。

範例:

hdr__EMPLOYEES_key_id

類型 1 維度檢視

檢視名稱格式:<DATA_ASSET_SCHEMA>.[<PREFIX>]<DIMENSION>

下列標頭欄已新增至檢視結構:

表格標頭欄位

資料行

類型

描述

hdr_{dimension-name}_key_id int64

序列隨每筆記錄增量。

hdr__deleted 布林

指示是否已從維度表刪除記錄。

類型 2 維度檢視

檢視名稱格式:<INTERNAL_SCHEMA>.[<PREFIX>]<DIMENSION>

下列標頭欄已新增至檢視結構:

表格標頭欄位

資料行

類型

描述

hdr_{dimension-name}_key_id

int64

序列隨每筆記錄增量。

hdr__from_timestamp 時間戳記

此記錄版本的 UTC 開始時間戳記。例如,欄可能會指示客戶開始居住於特定地址的日期。

此欄可讓您:

  • 根據歷史資訊分析資料。例如,您可以決定訂單處於擱置中狀態的時間長度或客戶地址變更如何影響相較於去年資料的銷售額。
  • 依日期分析資料,但知道您目前知道的內容。相對地,以下所述的 hdr__was_current_from_timestamp 可讓您依特定日期分析資料,僅知道您當時知道的內容。

對於具有去正規化實體的類型 2 維度,此為來自儲存或轉換資料資產中已更新資料集的時間戳記。

hdr__to_timestamp 時間戳記

記錄版本的 UTC 結束時間戳記。該欄用來界定指定記錄版本的日期範圍。例如,欄可能會指示客戶停止居住於特定地址的日期。

也請參閱以上 hdr_from_timestamp 欄的描述。

hdr__operation varchar(1)

完整載入操作:

  • L:已在完整載入期間插入

變更處理操作 (使用變更表格):

  • D:已刪除
  • U:已更新
  • I:已插入

比較和套用操作所產生的動作:

  • d:已刪除
  • u:已更新
  • i:已插入
hdr__was_current_from_timestamp 時間戳記

顯示上次更新套用至記錄時的 UTC 時間戳記。

此欄與 hdr__was_current_to_timestamp 欄可讓您依特定日期分析資料,僅知道您當時知道的內容。例如,假設您每天在凌晨 2:00 計算前一天的訂單總額。因此在 12 月 1 日,前一天的訂單總和是 $1,000,000。不過,在 12 月 2 日,插入的記錄顯示在 11 月 30 日,下單總額為 $500,000。因此 11 月 30 日的訂單額實際上是 $1,500,000!不過,若您根據 12 月 1 日凌晨 2:00 的當下內容產生 11 月 30 日的訂單總和報告,結果仍會是 $1,000,000。

hdr__was_current_to_timestamp 時間戳記

以較新的記錄取代記錄時會填入此欄。這顯示處理記錄時的 UTC 時間戳記,因此不會晚於最新記錄。

也請參閱以上 hdr__was_current_from_timestamp 欄的描述。

此頁面是否對您有幫助?

若您發現此頁面或其內容有任何問題——錯字、遺漏步驟或技術錯誤——請告知我們可以如何改善!