儲存串流資料集
下列串流轉換任務設定適用於使用串流來源的 Qlik 開放湖倉庫 專案。
您可以使用串流轉換資料任務來儲存和轉換串流資料。串流資料通常包含需要扁平化的巢狀結構和陣列,並且在儲存階段需要轉換功能。這些功能適用於串流轉換任務,讓您可以在登陸串流資料後立即套用轉換。
管理資料集精細度
您可以扁平化巢狀結構和陣列以增加精細度。精細度會顯示在資料集檢視中。按一下 以編輯精細度:
-
從陣列中選取欄位將會導致目標資料表包含每個元素一列。這會增加目標中的列數。
-
您必須從相同的陣列路徑選取欄位。從不同路徑選取欄位將會引發驗證錯誤。
-
顯示的資料類型反映選取的精細度。例如,ARRAY<INT> 在扁平化時會變成 INT。如需詳細資訊,請參閱資料類型對應。
刪除任務
如果資料任務未執行,且相同專案中沒有下游任務的相依性,您可以刪除該資料任務。
-
在專案的管線專案檢視中,按一下任務上的
,然後選取刪除。
任務建立的成品 (表格和檢視) 也會被刪除,除非您選擇保留它們。
檢視任務資訊
按一下功能表長條上的 以檢視任務資訊,例如:
-
擁有者
-
空間
-
資料平台
-
專案 ID
-
資料任務執行階段 ID
串流轉換設定
儲存空間的設定
若資料平台為 Qlik 開放湖倉庫,您可以設定串流轉換資料任務的屬性。
-
按一下設定。
一般設定
-
任務結構描述
您可以變更串流轉換任務結構描述的名稱。預設名稱是儲存任務的名稱。
-
內部架構
您可變更內部儲存空間資料資產架構的名稱。預設名稱是附加 _internal 的儲存任務名稱。
- 用於所有表格和檢視的前置詞
您可以為透過此任務建立的所有表格和檢視畫面設定前置詞。
資訊備註若您想要在數個資料任務中使用一個資料庫結構描述,則必須使用唯一前置詞。 -
要使用的資料夾
您可以變更串流轉換任務儲存資料夾。
-
載入新資料集的設定
-
僅附加
新增新的記錄而不修改現有資料。若出現複製記錄,則不會強制執行索引鍵限制。
-
套用變更
更新現有記錄並根據索引鍵欄位插入新的記錄。
如果您選擇合併變更,也可以選取下列項目:
-
透過提供刪除運算式來軟刪除記錄
定義刪除運算式以標記要刪除的記錄。
-
保留歷史記錄 (類型 2)
保留已變更記錄的先前版本。
-
-
-
欄取消巢狀
-
保留巢狀欄
選取以保留巢狀資料。
-
對獨立的欄取消巢狀
預設行為是將資料取消巢狀化為個別欄。
-
-
目標表格分割
資訊備註此選項僅在僅附加在載入設定中選取時可用。-
無分割區
新資料表建立時不含分割區。
-
依事件日期分割區
新資料表會依事件擷取日期分割區。
-
-
資料變更處理
資訊備註只有在 載入設定 中選取 套用變更 時,此選項才可用。-
包含軟刪除:輸入運算式以定義要標記為刪除的記錄。
-
建立歷程資料存放區 (類型 2):這將保留已變更記錄的先前版本。
-
- 保留管理
-
沒有分割剪除
-
目前快照分割剪除
-
執行時間設定
-
湖存放庫叢集
您可以變更 Lakehouse 叢集,但這必須支援串流工作負載或混合式工作負載。
結構描述演進設定
-
在根層級新增欄
新欄在根層級新增至串流登陸任務時,此設定適用。
-
套用至目標
自動將新的根層級欄從串流登陸任務新增至串流轉換任務。這是預設設定。
-
忽略
不新增新的根層級欄。
-
停止任務
如果在串流登陸任務中偵測到新的根層級欄,則停止轉換任務。
-
-
將欄新增至結構
在串流登陸任務的現有巢狀結構內部新增新欄位時,此設定適用。
- 套用至目標
如果新欄位已新增至登陸結構,則自動將其新增至串流轉換任務中的現有結構。
-
忽略
不新增新欄位至現有結構。
-
停止任務
如果串流登陸任務中的結構新增欄位,則停止轉換任務。
- 套用至目標
-
變更欄位資料類型
- 忽略
不變更資料類型。
-
停止任務
如果串流登陸任務中偵測到資料類型變更,則停止轉換任務。
- 忽略
資料集設定
下列設定適用於 設計 檢視 > 資料集 中的所有資料集。
按一下資料集旁的 ,然後選取 設定。
-
資料載入處理
選取資料如何載入到目標表格中。
-
僅附加
新增新的記錄而不修改現有資料。若出現複製記錄,則不會強制執行索引鍵限制。
-
套用變更
更新現有記錄並根據索引鍵欄位插入新的記錄。
-
-
資料變更處理
資訊備註只有在 載入設定 中選取 套用變更 時,此選項才可用。-
包含軟刪除:輸入運算式以定義要標記為刪除的記錄。這應該是若變更是軟刪除則驗證為 True 的運算式。
範例: operation = 'D'
-
建立歷程資料存放區 (類型 2):這將保留已變更記錄的先前版本。
-
-
分割欄
您可以選擇性地選取分割欄以最佳化效能。
點擊 新增欄 以新增分割區欄,然後選取 轉換,並視需要設定 參數。
-
保留管理
分割區修剪會移除超過保留期間的分割區。這不會實際刪除資料,也不會立即影響較舊的快照。較舊的資料可能仍可在較舊的快照中取得,直到它們過期為止。
資訊備註僅在分割區至少有一個日期或日期時間欄時顯示。-
沒有分割剪除
-
目前快照分割剪除
-
-
排序欄
資訊備註此選項僅在載入設定中選取僅附加時可用。您可以選擇性地指定 Iceberg 表格的每個檔案內將會排序哪些資料的欄。在資料擷取期間,Iceberg 會使用這些欄排序記錄。在查詢中常用的欄定義排序索引鍵,可改善資料位置,產生更快的讀取效能和更有效率的壓縮。正確設定的排序索引鍵可確保您的資料有最佳的組織,以利查詢效能。
按一下新增欄以新增排序欄,然後設定排序順序。
-
快照到期持續時間
此設定控制快照保留多長時間,這會大幅影響表格大小和儲存成本。對於經常更新的表格,建議使用較短的持續時間,以協助降低儲存成本。
資訊備註輸入 0 以停用快照到期。