儲存串流資料集 | Qlik Cloud 說明
跳到主要內容 跳至補充內容

儲存串流資料集

下列「串流轉換」工作設定適用於使用串流來源的 Qlik 開放湖倉庫 專案。

您可以使用「串流轉換資料」工作來儲存和轉換串流資料。串流資料通常包含需要壓平合併的巢狀結構和陣列,且在儲存階段需要轉換功能。這些功能可用於「串流轉換」工作,讓您在登陸串流資料後立即套用轉換。

管理資料集細微度

您可以壓平合併巢狀結構和陣列以增加細微度。細微度會顯示在「資料集」檢視中。按一下 編輯 以編輯細微度:

  • 從陣列中選取欄位將導致目標表格每個元素包含一個資料列。這將增加目標中的資料列數。

  • 您必須從相同的陣列路徑選取欄位。從不同路徑選取欄位將引發驗證錯誤。

  • 顯示的資料類型反映所選的細微度。例如,ARRAY<INT> 在壓平合併時會變成 INT。如需詳細資訊,請參閱 資料類型對應

刪除工作

如果資料任務未執行,且相同專案中沒有下游任務的相依性,您可以刪除該資料任務。

  • 在專案的管線專案檢視中,按一下任務上的更多,然後選取刪除

任務建立的成品 (表格和檢視) 也會被刪除,除非您選擇保留它們。

資訊備註請記住,您保留的成品將不再由任務更新。

檢視任務資訊

按一下功能表長條上的 資訊 以檢視任務資訊,例如:

  • 擁有者

  • 空間

  • 資料平台

  • 專案 ID

  • 資料任務執行階段 ID

串流轉換設定

當資料平台為 Qlik 開放湖倉庫 時,您可以設定「串流轉換資料」工作的屬性。

  • 按一下設定

一般設定

  • 工作架構

    您可以變更「串流轉換」工作架構的名稱。預設名稱為儲存工作的名稱。

  • 內部架構

    您可以變更內部儲存資料資產架構的名稱。預設名稱為附加 _internal 的儲存工作名稱。

  • 用於所有表格和檢視的前置詞

    您可以為透過此任務建立的所有表格和檢視畫面設定前置詞。

    資訊備註若您想要在數個資料任務中使用一個資料庫結構描述,則必須使用唯一前置詞。
  • 要使用的資料夾

    您可以變更「串流轉換」工作儲存資料夾。

  • 新資料集的載入設定

    • 僅附加

      新增記錄而不修改現有資料。如果到達複製記錄,則不會強制執行索引鍵條件約束。

    • 套用變更

      根據索引鍵欄位更新現有記錄並插入新記錄。

      如果您選擇合併變更,您也可以選取下列項目:

      • 透過提供刪除運算式來軟刪除記錄

        定義刪除運算式以將記錄標記為刪除。

      • 保留歷史記錄 (類型 2)

        保留已變更記錄的先前版本。

  • 欄取消巢狀

    • 保留巢狀欄

      選取以保留巢狀資料。

    • 取消巢狀為個別欄

      預設行為是將資料取消巢狀為個別欄。

  • 目標表格分割區

    資訊備註只有在載入設定中選取僅附加時,才可使用此選項。
    • 無分割區

      建立新表格時不包含分割區。

    • 依事件日期分割

      新表格會依擷取事件的日期進行分割。

  • 資料變更處理

    資訊備註只有在載入設定中選取套用變更時,才可使用此選項。
    • 包含軟刪除:輸入運算式以定義要標記為刪除的記錄。

    • 建立歷史資料存放區 (類型 2):這將保留已變更記錄的先前版本。

  • 保留管理
    • 無分割區剪除

    • 目前快照分割區剪除

表格定義

  • hdr__from_timestamp

    啟用此選項時,hdr__from_timestamp 標頭欄將出現在標準檢視中。此外,在入門精靈中選取 依事件擷取日期分割 時,hdr__from_timestamp 將用作預設分割欄。

    資訊備註無論此設定為何,歷程記錄檢視一律包含所有標準檢視標頭欄。

執行階段設定

  • Lakehouse 叢集

    您可以變更 lakehouse 叢集,但這必須支援串流工作負載或混合工作負載。

架構演進設定

  • 在根層級新增欄

    當在根層級將新欄新增至串流登陸工作時,會套用此設定。

    • 套用至目標

      自動將「串流登陸」工作中的新根層級欄新增至「串流轉換」工作。這是預設設定。

    • 忽略

      不新增新的根層級欄。

    • 停止工作

      如果在串流登陸工作中偵測到新的根層級欄,則停止轉換工作。

  • 將欄新增至結構

    當在串流登陸工作中的現有巢狀結構內新增欄位時,會套用此設定。

    • 套用至目標

      如果將新欄位新增至登陸結構,則會自動將其新增至「串流轉換」工作中的現有結構。

    • 忽略

      不將新欄位新增至現有結構。

    • 停止工作

      如果將新欄位新增至「串流登陸」工作中的結構,則停止轉換工作。

  • 變更欄位資料類型

    • 忽略

      不變更資料類型。

    • 停止工作

      如果在「串流登陸」工作中偵測到資料類型變更,則停止轉換工作。

資料集設定

下列設定適用於設計檢視 > 資料集中的所有資料集。

按一下資料集旁邊的 更多,然後選取設定

  • 資料載入處理

    選取將資料載入目標表格的方式。

    • 僅附加

      新增記錄而不修改現有資料。如果到達複製記錄,則不會強制執行索引鍵條件約束。

    • 套用變更

      根據索引鍵欄位更新現有記錄並插入新記錄。

  • 資料變更處理

    資訊備註只有在載入設定中選取套用變更時,才可使用此選項。
    • 包含軟刪除:輸入運算式以定義要標記為刪除的記錄。這應該是如果變更為軟刪除則驗證為 True 的運算式。

      範例: operation = 'D'

    • 建立歷史資料存放區 (類型 2):這將保留已變更記錄的先前版本。

  • 分割區欄

    您可以選擇性地選取分割區欄以最佳化效能。

    按一下新增欄以新增分割區欄,然後選取轉換,並在需要時設定參數

  • 保留管理   

    分割區剪除會移除早於保留期間的分割區。這不會實體刪除資料,也不會立即影響較舊的快照。較舊的資料可能會在較舊的快照中提供,直到它們過期為止。

    資訊備註只有在分割區至少有一個日期或日期時間欄時才會出現。
    • 無分割區剪除

    • 目前快照分割區剪除

  • 排序欄

    資訊備註只有在載入設定中選取僅附加時,才可使用此選項。

    您可以選擇性地指定在 Iceberg 表格的每個檔案中用來排序資料的欄。在資料擷取期間,Iceberg 會使用這些欄來排序記錄。在查詢中經常使用的欄上定義排序索引鍵可改善資料局部性,從而產生更快的讀取效能和更有效率的壓縮。正確設定的排序索引鍵可確保您的資料以最佳方式組織,以獲得查詢效能。

    按一下新增欄以新增排序欄,然後設定排序順序。

  • 快照過期持續時間

    此設定控制保留快照的時間長度,這會顯著影響表格大小和儲存成本。對於經常更新的表格,建議使用較短的持續時間以協助降低儲存成本。

    資訊備註輸入 0 以停用快照過期。
  • 標準檢視標頭

    • 從資料工作設定繼承

      這是預設值。如果您只想為此資料集設定特定的標頭欄,請停用。

    • hdr__from_timestamp

      啟用此選項時,hdr__from_timestamp 標頭欄將出現在標準檢視中。此外,在入門精靈中選取 依事件擷取日期分割 時,hdr__from_timestamp 將用作預設分割欄。

      資訊備註無論此設定為何,歷程記錄檢視一律包含所有標準檢視標頭欄。

此頁面是否對您有幫助?

若您發現此頁面或其內容有任何問題——錯字、遺漏步驟或技術錯誤——請告知我們!