跳到主要內容 跳至補充內容

湖登陸設定

以下湖登陸任務設定適用於 Qlik 開放湖倉庫 專案。

您可為湖登陸資料任務進行設定。

  • 開啟登陸任務並在工具列中按一下設定

就會開啟 設定:<Task-Name> 對話方塊。可用設定如下所述。

一般

  • 更新方法

    登陸任務一律以完整載入開始。完整載入完成後,您可以使用下列方法之一,將登陸的資料保持為最新狀態:

    資訊備註登陸資料任務準備操作完成後,就無法變更更新方法。
    • 變更資料擷取 (CDC)

      登陸資料會使用 CDC (變更資料擷取) 技術保持最新狀態。CDC 不一定受到所有資料來源的支援。CDC 不會擷取 DDL 操作,例如將欄重新命名或變更中繼資料。

      若資料也包含不支援 CDC 的檢視或表格,將會建立兩個資料管道。一個管道具有支援 CDC 的所有表格,另一個管道具有使用載入作為更新方法的所有其他表格和檢視。

    • 載入

      會從來源載入所有登陸的資料。若來源不支援 CDC,但可搭配任何支援的資料來源使用,則這很實用。

      您可以定期排程載入。

      資訊備註使用 SaaS 應用程式預覽連接器時,此設定不適用。在建立連線對話方塊和線上說明中,預覽連接器以 預覽按鈕的影像 按鈕指示。
  • 要使用的資料夾

    選取將資料登陸到暫存區域時要使用的資料夾。

    • 預設資料夾

      如此可建立預設名稱為 <專案名稱>/<資料任務名稱> 的資料夾。

    • 根資料夾

      將資料存放在儲存區的根資料夾。

    • 資料夾

      指定要使用的資料夾名稱。

  • 資料上傳

    檔案屬性

    設定用於上傳資料的檔案設定。

    • 欄位分隔符號

      來源資料檔案中使用的欄位分隔符號字元。預設為「,」。
    • Null 值

      選用的預設字串,用於替換來源資料檔案中的 Null 值。
    • 記錄分隔符號

      來源資料檔案中使用的記錄分隔符號字元。預設為「\n」。
    • 引號字元

      來源資料檔案中使用的引號字元。預設為「"」。
    • 引號逸出字元

      來源資料檔案中使用的引號逸出字元。預設為「"」。
    • 最大檔案大小 (KB)

      檔案在關閉之前可達到的大小上限。較小的檔案可能上傳得更快 (取決於網路),並且可在結合平行執行選項使用時改善效能。不過,以小檔案叢集資料庫通常被視為不良做法。

    • 使用以下內容壓縮檔案

      選取後,將會使用 GZIP 壓縮 CSV 檔案。

      資訊備註
      • 需要 資料移動閘道 2023.5.16 或更高版本。

    中繼資料

    LOB 欄

    • 納入 LOB 欄並將欄大小限制為 (KB):

      您可選擇在任務中納入 LOB 欄,以及設定最大 LOB 大小。將會截斷大於最大大小的 LOB。

    完整載入

    資訊備註這些設定不適用於透過 SaaS 應用程式預覽連接器定義的任務。在建立連線對話方塊和線上說明中,預覽連接器以 預覽按鈕的影像 按鈕指示。

    效能微調

    • 要平行載入的表格數量上限:輸入一次載入到目標中的表格數量上限。預設值為 5
    • 交易一致性逾時 (秒):輸入在開始完整載入操作之前等待開放的交易關閉的秒數。預設值為 600 (10 分鐘)。將會在達到逾時值之後開始完整載入,即使有仍然開放的交易也是如此。

      資訊備註若要複寫完整載入開始時開放但僅在達到逾時值之後認可的交易,您需要載入目標表格。
    • 完整載入期間的認可率:可以一起傳輸的事件數量上限。預設值為 10000

    完整載入完成之後

    建立主要金鑰或唯一:若您想要在完整載入完成之前,對資料平台延遲主要金鑰或唯一索引建立,請選取此選項。

    處理時發生錯誤

    資訊備註

    僅變更資料擷取 (CDC) 更新方法支援資料錯誤處理。

    對於資料截斷錯誤:選取當截斷發生於一個或多個特定記錄時,您想要發生的事項。您可以從清單中選取下列內容之一:

    • 忽略:任務會繼續並忽略錯誤。
    • 暫停表格:任務會繼續,但具有錯誤記錄之表格中的資料會移至錯誤狀態,並且不會複寫其資料
    • 停止任務:任務會停止,需要手動干預。

    對於其他資料錯誤:選取當錯誤發生於一個或多個特定記錄時,您想要發生的事項。您可以從清單中選取下列內容之一:

    • 忽略:任務會繼續並忽略錯誤。
    • 暫停表格:任務會繼續,但具有錯誤記錄之表格中的資料會移至錯誤狀態,並且不會複寫其資料
    • 停止任務:任務會停止,需要手動干預。

    在達到其他資料錯誤 (每個表格) 時呈報錯誤處理:選取此核取方塊,以在非截斷資料錯誤數量 (每個表格) 達到指定量時呈報錯誤處理。有效值為 1-10,000。

    呈報動作:選擇呈報錯誤處理時應發生什麼事。請注意,可用動作取決於從上述對於其他資料錯誤下拉式清單中選取的動作。

    • 暫停表格 (預設):任務會繼續,但具有錯誤記錄之表格中的資料會移至錯誤狀態,並且不會landed其資料。

    • 停止任務:任務會停止,需要手動干預。

    表格錯誤

    此選項可讓您控制何時觸發表格錯誤處理原則。依預設,遇到表格錯誤後,表格將會暫停或工作將會在三次重試後停止 (根據選取的動作)。有時,會因為 SaaS 應用程式的計劃性維護而發生表格錯誤。在這些情況下,預設的重試次數可能不足以在觸發表格錯誤處理原則之前完成維護。這也取決於工作的排程間隔,因為每次工作執行時都會執行一次重試。因此,例如,如果您排程工作每小時執行一次,且 SaaS 應用程式在工作開始執行時因維護而離線,則預設的三次重試將允許 SaaS 應用程式離線長達三小時,而不會觸發表格錯誤處理原則。更長的維護期間將需要您增加重試次數 (或變更排程),以防止觸發表格錯誤處理原則。

    總而言之,如果您知道您的 SaaS 應用程式會定期維護,最佳做法是根據排程增加重試次數,以便在不觸發表格錯誤處理原則的情況下完成維護。

    資訊備註
    • 此選項將僅顯示給設定為 Lite 或 Standard SaaS 應用程式連接器的工作。

    • 如果您使用 資料移動閘道,則需要版本 2024.11.70 或更高版本。

    遇到表格錯誤時:從下拉式清單選取下列內容之一:

    • 暫停表格 (預設):任務會繼續,但具有錯誤記錄之表格中的資料會移至錯誤狀態,並且不會複寫其資料
    • 停止任務:任務會停止,需要手動干預。

    在表格錯誤達到時呈報錯誤處理 (每個表格):選取此核取方塊,以在表格錯誤數量 (每個表格) 達到指定量時呈報錯誤處理。有效值為 1-10,000。

    呈報動作:表格錯誤的呈報政策設定為停止任務且無法變更。

    環境

    • 重試計數上限:選取此選項,然後指定在可修復的環境錯誤發生時重試任務的嘗試次數上限。在重試任務達到指定次數之後,任務會停止,需要手動干預。

      若絕對不要重試任務,清除核取方塊或指定「0」。

      若要重試任務無限次數,指定「-1」

      • 重試嘗試之間的間隔 (秒):使用計數器以選取或輸入系統在每次嘗試重試任務之間等待的秒數。

        有效值為 0-2,000。

    • 對長時間中斷增加重試間隔:選取此核取方塊以對長時間中斷增加重試間隔。若啟用此選項, 會加倍每次重試嘗試之間的間隔,直到達到重試間隔上限為止 (並根據指定的間隔上限繼續重試)。
      • 重試間隔上限 (秒):在啟用對長時間中斷增加重試間隔選項時,使用計數器以選取或輸入每次嘗試重試任務之間等待的秒數。有效值為 0-2,000。

    變更處理微調

    資訊備註只有在更新方法為變更資料擷取 (CDC) 時,此索引標籤才能使用。

    交易卸載微調

    對磁碟的卸載交易進行中,條件是

    通常會將交易資料保留在記憶體中,直到對來源或目標完全認可為止。不過,大於配置記憶體或未在指定期限內認可的交易將會卸載到磁碟。

    • 所有交易記憶體總大小超過 (MB):在卸載到磁碟之前,所有交易可以在記憶體中占用的大小上限。預設值為 1024。
    • 交易期間超過 (秒):在卸載到磁碟之前,每筆交易可以在記憶體中停留的時間上限。持續時間是從 Qlik Talend Data Integration 開始擷取交易的時間計算。預設值為 60。

    批次微調

    • 每個交易的變更數量下限:要在每個交易中納入的變更數量下限。預設值為 1000

      資訊備註

      若變更數量等於或大於每個交易的變更數量下限值,或者若達到套用之前的批次交易時間上限 (秒) 值 (以先發生者為主), 會將變更套用至目標。因為套用至目標的變更頻率由這兩個參數控制,對來源記錄的變更可能不會立即反映在目標記錄中。

    • 套用之前的批次交易時間上限 (秒):宣告逾時之前批次收集交易的時間上限。預設值為 1

    雜項微調

    • 陳述式快取大小 (陳述式數量):要儲存在伺服器以供之後執行的所準備之陳述式數量上限 (將變更套用至目標時)。預設為 50。上限為 200。
    • 在更新主要金鑰欄時刪除和插入:此選項需要在來源資料庫中開啟完全補充記錄。

    結構描述演進

    選取如何處理結構描述中以下類型的 DDL 變更。變更結構描述演進設定後,您必須重新準備任務。下表描述了哪些動作可用於支援的 DDL 變更。

    資訊備註若透過 SaaS 應用程式預覽連接器設定了任務,則僅支援變更欄資料類型 DDL 變更。若要瞭解您的連接器是否處於預覽狀態,請參閱連接器說明。
    DDL 變更套用至目標忽略暫停表格停止任務
    新增欄
    重新命名欄
    重新命名表格
    變更欄資料類型
    建立表格

    如果您使用選取規則新增與模式相符的資料集,則會偵測到並新增符合該模式的新表格。

    字元替代

    您可以替代或刪除目標資料庫中的來源字元,以及/或您可以替代或刪除所選字元集合不支援的來源字元。

    資訊備註
    • 必須指定所有字元作為 Unicode 字碼指標。

    • 也會在控制表格執行字元替代。
    • 將會透過表格儲存格右上方的紅色三角形指示無效的值。將滑鼠游標暫留在三角形上方,將會顯示錯誤訊息。

    • 將會在字元替代完成之後,執行為任務定義的任何表格層級或全域轉換。

    • 會在替代或刪除所選字元集合不支援的來源字元表格中定義的替代動作之前,執行替代或刪除來源字元表格中定義的替代動作。

    • 字元替代不支援 LOB 資料類型。

    替代或刪除來源字元

    使用替代或刪除來源字元表格,以定義更換特定來源字元。例如,若 Unicode 字元表示法在來源和目標平台不同,這可能會很實用。例如,在 Linux,Shift_JIS 字元集合中的減號字元以 U+2212 表示,但在 Windows 則以 U+FF0D 表示。

    替代動作
    進行此

    定義替代動作。

    1. 按一下表格上方的新增字元按鈕。

    2. 分別在來源字元替代字元欄位中指定來源字元和目標字元。

      例如,若要以字母「e」取代字母「a」,請分別指定 00610065

      資訊備註

      若要刪除指定的來源字元,在替代字元欄中輸入 0

    3. 重複步驟 1-2 以取代或刪除其他字元。

    編輯指定的來源或目標字元

    按一下列末尾的 ,並選取編輯

    從表格中刪除項目

    按一下列末尾的 ,並選取刪除

    替代或刪除所選字元集合不支援的來源字元

    使用字元集合不支援的來源字元表格,為所選字元集合不支援的所有字元定義單一替換字元。

    不支援的字元替代動作
    進行此

    定義或編輯替代動作。

    1. 從表格中的字元集合下拉式清單選取字元集合。

      將會透過以下步驟 2,在目標以指定的字元取代所選字元集合不支援的任何字元。

    2. 替代字元欄中,按一下欄中的任何地方並指定替換字元。例如,若要以字母「a」取代所有不支援的字元,請輸入 0061

      資訊備註

      若要刪除所有不支援的字元,請輸入 0

    停用替代動作。

    字元集合下拉式清單中選取空白項目。

    更多選項

    不會在 UI 中暴露這些選項,因為這僅與特定版本或環境相關。因此,請勿設定這些選項,除非 Qlik 支援或產品文件明確指示這麼做。

    若要設定選項,只要在新增特徵名稱欄位中複製選項並按一下新增即可。然後根據您收到的說明設定值或啟用選項。

    平行載入資料集區段

    資訊備註此設定不適用於 SaaS 應用程式來源,僅適用於來源資料庫和目標資料庫的特定子集。

    在完整載入期間,您可以將資料集分成多個平行載入的區段,以加速大型資料集的載入。表格可以按照資料範圍、所有分割、所有子分割或特定分割進行分割。

    如需詳細資訊,請參閱 平行登陸資料集區段

    在不使用 資料移動閘道 時排程 CDC 任務

    Qlik Talend Cloud 啟動器 訂閱不支援 資料移動閘道,可透過其他訂閱層級選用。不使用 資料移動閘道 時,您可設定排程間隔,以讓目標資料保持在最新狀態。排程決定透過來源資料集變更更新目標資料集的頻率。排程決定更新頻率,而資料集類型則決定更新方法。若來源資料集支援 CDC (變更資料擷取),只會複寫來源資料的變更並套用至對應的目標表格。若來源資料集不支援 CDC (例如檢視畫面),則會將所有來源資料載入到對應的目標表格,以套用變更。若有些來源資料集支援 CDC,而有些不支援,將會建立兩個獨立的子任務:一個用於載入不支援 CDC 的資料集,另一個用於對支援 CDC 的資料集擷取變更。在此情況下,為了確保資料一致性,強烈建議為兩個子任務設定相同的排程。

    如需關於根據資料來源類型和訂閱層級的最低排程間隔的資訊,請參閱 最低允許的排程間隔

    若要變更排程:

    1. 開啟資料專案,然後進行下列事項之一:

      • 在任務檢視中,按一下資料任務上的 包含 3 個水平方向圓點的功能表按鈕。 並選取排程
      • 在管道檢視中,按一下資料任務上的 包含 3 個垂直方向圓點的功能表按鈕。 並選取排程
      • 開啟登陸任務並按一下排程工具列按鈕。
    2. 根據需求變更排程設定,然後按一下確定

    此頁面是否對您有幫助?

    若您發現此頁面或其內容有任何問題——錯字、遺漏步驟或技術錯誤——請告知我們!