建立和管理資料超市
設置資料後,接著就可以使用 儲存區或轉換任務建立資料超市。依據業務需求,可建立所需數量的資料超市。理想情況下,您的資料超市應該包含,針對特別組織內特別區段或單位(例如:銷售部門)的分析收集來的歸納資料。
無論資料超市建立在儲存區任務或轉換任務,建立程序都是一樣的。此區段說明以儲存區任務為主的資料超市。
必要條件
在建立資料超市之前,必須採取以下步驟:
- 更新儲存區中您想要在資料超市使用的資料(從登陸)。如需詳細資訊,請參閱上線資料。
-
建立資料集關係模型定義來源資料及之間的關係。如需詳細資訊,請參閱 建立資料模型。
警告備註所有來源資料集都必須有金鑰。
建立資料超市
要建立資料超市:
-
開啟專案。
-
執行下列其中一個動作:
- 按一下右上角的新增並選取建立資料超市。
-
在儲存資料任務中,按一下右下角的 ,然後選取建立資料超市。
建立資料超市 對話方塊開啟。
-
提供資料超市名稱,可自行選取是否提供說明。
-
如果想要稍後組態資料超市,清除 開啟 核取方塊並按一下 建立。否則只需按一下 建立。
資料超市在 資料超市 標籤中開啟。
- 如說明,在 選取來源資料 中選取來源資料
- 如果想要資料超市包含維度,如說明,請在 新增維度和事實至資料超市 新增維度
- 如果想要資料超市包含事實,如說明,請在 新增事實 新增事實
- 如果資料超市包含維度和事實,如說明,請在 建立星狀結構描述 星狀結構描述新增維度。
- 在資料超市建立資料庫,並如說明,在 填入資料超市 填入資料。
選取來源資料
您選取儲存區資料任務中資料集的來源資料。
要執行的操作:
-
按一下標籤中間的 選取來源資料 按鈕或按一下 選取來源資料 任務列按鈕。
選取來源資料 對話方塊開啟。
-
從 資料資產 下拉式選單,選取想要建立轉換的儲存區任務或轉換任務。
-
針對所有資料集保留預設 % 進行搜尋或輸入要尋找的特定資料集名稱。再按一下 搜尋。
-
選取想要的資料集,再按一下 新增所選表格。
-
按一下 OK 關閉對話方塊,再繼續 新增事實及/或 新增維度。
新增維度和事實至資料超市
選取來源資料之後,可以繼續建立資料超市。資料超市可擁有事實資料集、維度資料集或結合兩者(維度資料集在邏輯上與事實資料集相關)。
新增維度
要新增維度。
-
按一下新增維度按鈕。
新增維度對話方塊開啟。
-
下列設定可供使用:
- 最細微的資料集:選取資料集。
- 名稱: 指定維度顯示名稱。預設為最細微的資料集名稱。
- 描述:或可選取提供描述。
- 歷史記錄類型:選擇以下其中一項:
- 類型 1:維度中的既有記錄將在儲存區相對應記錄更新時更新。
- 類型 2:新記錄將在儲存區相對應記錄更新時新增至維度。
-
要取消正規化的相關資料集:任何維度資料集中可被取消正規化的資料集(依據來源資料資產模型的關係)可在此選取。
-
按一下 OK 儲存設定。
維度將新增至左側的 維度 清單。
另請參閱 扮演維度的角色。
維度的檢視資訊
當您選取維度時,中央窗格將會顯示 來源相關模型 標籤。此標籤顯示維度中匯總的來源資料集。在新增維度時選取取消正規化的資料集將顯示為已選取(且灰色處理)。
新增事實
要新增事實:
-
按一下新增事實按鈕。
隨即會開啟新增事實對話方塊。
-
下列設定可供使用:
- 事實:選取要成為事實的資料集。資料集應定義正在建立事實的精細程度。
- 名稱: 指定事實顯示名稱。預設為事實名稱。
- 描述:或可選取提供描述。
- 要取消正規化的相關資料集:在事實資料集中可以取消正規化的任何資料集都能在此處選取。
- 進階
- 使用目前資料: 選取時 (預設),事實將不包含交易日期欄。
-
選擇交易日期: 若要根據特定交易日期找到資料,選取此選項,然後選取日期欄。若星狀結構描述包含類型 2 維度,且您需要尋找特定交易的正確資料,則這很實用。例如,若客戶有多個地址,可能可以根據訂單日期找到正確地址。
使用情況範例:
零售商需要建立資料超市,以分析訂單和客戶之間的關係。資料超市應能夠回答諸如以下問題的查詢:Which US state had the highest sum of orders in Q4 2022? (美國哪一州在 2022 第 4 季的訂單總和最高?)
若零售商選取使用目前資料選項,則計算中只會納入客戶表格中的最新記錄版本。
忽略交易日期將會產生不精確的資料,如下圖所示:
不過,若零售商選取選擇交易日期選項,客戶的訂單將與客戶表格中的正確記錄版本相關聯。
這可讓零售商精確計算 2022 年第 4 季每州的訂單總和。
提示備註請注意,可以根據商務需求,在每個資料超市中以不同的方式運用交易日期。例如,在某個資料超市,這可用來分析訂單日期,而在另一個資料超市,這可用來分析出貨日期。
-
按一下 OK 儲存設定。
事實將新增於左側的 事實清單上。
事實檢視資訊
選取事實時,中央窗格將顯示以下標籤:
- 星狀結構描述模型(預設): 顯示資料超市中資料集關係的圖形呈現。
-
事實模型: 顯示與事實資料集相關的任何資料集。在新增事實時選取取消正規化的資料集將顯示為已選取(且灰色處理)。
- 交易日期: 新增事實時選取選擇交易日期選項時的交易欄名稱。
建立星狀結構描述
新增維度至資料超市之後,能繼續將其與事實資料集連線,藉此建立星狀結構描述。
要執行的操作:
- 在左側的事實清單中選取事實。
-
在右側 推薦維度 中選取要新增的維度。
推薦維度與連線的事實資料集以點狀底線顯示。
在下圖中,之前已新增某些維度,因此以灰色實線連接。
-
按一下 套用 新增維度。
維度與連線的事實資料集會以灰色實線顯示。
-
若要關閉建議維度面板,按一下 。
填入資料超市
設計資料超市之後,可以開始填入。
要執行的操作:
-
按一下右上方的 準備 工具列按鈕。
準備程序包括在資料超市中建立資料集和檢視,以及更新目錄。
您可以在畫面下方的準備進度之下追蹤進度。
準備完成後, 準備 按鈕變更為 執行。
-
也可以選擇驗證資料超市,如以下的 驗證並同步資料超市 所述。
-
按一下 執行 按鈕。
視窗切換至 監控 檢視,顯示資料超市載入進度和狀態。
每一個來源記錄,甚至刪除的記錄都會經資料超市處理。這麼做是為了確保保留歷史資訊。
驗證並同步資料超市
驗證資料超市可確保資料超市中繼資料與儲存中對應的中繼資料相同 (或轉換 (如有定義))。驗證資料超市也能比較建立的中繼資料與目前的星狀結構描述設計。例如,若您在將維度新增至已建立的資料超市後執行驗證,則驗證將會失敗。
若要驗證資料超市:
-
從執行按鈕右側的 功能表選取驗證資料集或按一下視窗右下方的驗證資料集按鈕。
將會顯示驗證已完成訊息。
-
若中繼資料沒有同步,或者若有星狀結構描述設計衝突,則視窗底部的驗證並調整窗格將會連同驗證報告自動開啟。
具有星狀結構描述設計衝突的資料超市範例: 具有驗證錯誤的資料超市範例:
-
若要解決任何擱置中的設計變更問題,按一下右上方的 按鈕並選取準備。若可以改變且無資料損失欄的值為是,則會執行 ALTER (改變) 操作。否則,將會重新建立資料超市表格。
請注意,所有驗證錯誤都需要手動解決。
管理資料超市
此區段說明管理資料集和資料超市的多個可用選項。
精簡維度事實
在資料集 標籤,能進行多項操作精簡事實和維度,例如建立轉換規則(舉例還說,替換欄值)和新增欄層級運算式。資料集 標籤位於 資料集 標籤右邊:
新增規則
如何新增全域規則的說明,請參閱 建立規則以轉換資料集
新增新的欄
您可以將新的欄新增至目標資料集。
-
從頭開始新增新的欄
按一下 + 新增。
提供欄的名稱,並設定運算式以定義欄資料。
如需詳細資訊,請參閱 新增欄到資料集。
-
從來源新增欄
按一下新增旁邊的 ,然後選擇從來源新增欄。
從來源資料集選取欄。
重新排序欄
您可以變更欄的序數位置。
-
選取欄。
-
按一下 然後按一下重新排序。
-
使用箭頭向上或向下移動欄。
-
準備好後關閉變更序數 。
扮演維度的角色
扮演維度的角色是在相同的星狀結構描述內使用多次的相同維度,但有不同的意義。這在日期和客戶維度經常看見。例如,您的星狀結構描述可能有兩個日期實體,一個代表訂購日期,而另一個代表接收日期。
若要新增或編輯維度的角色名稱:
- 按一下維度節點中的 圖示並選取編輯角色。
在編輯角色對話方塊中,在星狀結構描述的角色名稱欄位中輸入名稱 (或編輯現有名稱) 並按一下確定。
角色名稱將會顯示在維度名稱下方。
其他管理選項
以下表格說明其它管理選項:
至 | 做法 |
---|---|
新增其他來源資料集 | 請參閱 選取來源資料。 |
新增其他事實 | 請參閱 新增事實 |
新增其他維度 | 請參閱 新增維度和事實至資料超市。 |
刪除維度 | 在 維度 窗格選取維度,再於 選單選取 刪除 。 |
刪除事實 | 在 事實窗格選取事實,再於 選單選取刪除。 |
重新建立資料超市 | 在右上角按一下 按鈕,再選取 重新建立表格。重新建立資料超市可能為必要,舉例來說,當儲存區有無法自動同步至資料超市的變更時。 |
停止執行資料超市任務 | 在右上角按一下 停止 按鈕。 |
準備資料超市任務 | 按一下右上方的 按鈕並選取準備,以同步資料集與轉換或儲存資產,並解決任何設計衝突。可準備要執行的任務。這包括:
您可以在畫面下方的準備進度之下追蹤進度。 |
排程資料超市任務
您可以排程定期更新資料超市任務。您可以設定基於時間的排程,或設定為在輸入資料任務完成執行後執行任務。
按一下資料任務上的 ... 並選取排程以建立排程。預設排程設定繼承自專案中的設定。如需關於預設設定的詳細資訊,請參閱 資料超市預設值。
您需要將排程設定為開啟以啟用排程。
基於時間的排程
無論不同的輸入來源於何時更新,您都可以使用基於時間的排程以執行任務。
在執行資料任務中選取在特定時間。
您可以設定每小時、每日、每週或每月排程。
基於事件的排程
您可以使用基於事件的排程,以在輸入資料任務完成執行後執行任務。
在執行資料任務中選取在特定事件。
您可以選取想要在任何輸入任務成功完成後執行任務,或是在任何輸入任務選項成功完成後執行任務。
載入資料
您可以執行手動資料載入。若一個或多個表格有問題,這很實用。
開啟資料任務並選取監控索引標籤。
選取您要載入的表格。
選取維度以進行載入時,也會載入使用該維度的所有事實,以維持完整性。
按一下載入表格。
您可以按一下取消載入,為等待載入的表格取消載入。這不會影響已載入的表格,且將會完成目前正在執行的載入。
載入透過以下方式執行:
截斷所選維度和事實。
從上游資料任務載入所選維度表格。
從上游資料任務載入事實資料表。這包括:
明確選取的事實資料表。
與載入之維度相關的事實資料表。
資料超市設定
按一下 設定 工具列按鈕以開啟 設定: <data-mart-name> 對話方塊。
一般設定
在 一般 標籤,能使用以下設定:
- 資料庫:資料超市將被建立的資料庫
- 資料任務結構描述:資料集將被建立的架構
- 內部架構:內部資料集將被建立的架構
- 用於所有表格和檢視的前置詞
您可以為透過此任務建立的所有表格和檢視畫面設定前置詞。
資訊備註若您想要在數個資料任務中使用一個資料庫結構描述,則必須使用唯一前置詞。
執行時間設定
在 執行時間 標籤,可使用以下設定:
- 平行執行:輸入 Qlik Cloud 獲允開啟任務的最大資料庫連線數量。預設數量為 10。
- 倉庫: 僅與 Snowflake 相關。Snowflake 資料倉庫名稱。
目錄設定
發佈至目錄
選取此選項以將此資料版本發佈至目錄作為資料集。將會在下次您準備此任務時更新目錄內容。
如需更多關於目錄的資訊,請參閱 使用目錄工具理解資料。