跳到主要內容 跳至補充內容

步驟 2:建立湖存放庫叢集

湖存放庫叢集定義了執行 Qlik 開放湖倉庫 儲存任務的運算環境。每個叢集指定包括執行個體數量、機器類型和擴充策略的設定。

當您為 Qlik 開放湖倉庫 管道專案建立網路整合時,會自動建立具有單一 AWS Spot 執行個體的叢集。不過,您可以在管理和 資料整合 活動中心建立其他叢集。

湖存放庫叢集將管道連結到一組 AWS 執行個體,讓您將關鍵工作指派至高效能叢集,將非關鍵工作負載指派至合乎成本效益的機器,以最佳化工作負載。

雖然一個叢集與單一 VPC 關聯,但多個叢集可以在相同的 VPC 內執行。此外,單一叢集可以執行多個工作。在建立湖存放庫叢集之前,定義工作負載的運算需求會很有幫助。可以根據需要修改叢集設定 (包括擴充策略),雖然某些變更可能需要復原叢集。如需更多關於編輯叢集設定的資訊,請參閱 管理湖存放庫叢集

建立湖存放庫叢集時,您可以指定 Qlik 提供的 Spot 和隨選執行個體的數量。如需更多關於 Qlik 如何利用叢集中的 Spot 和隨選執行個體的資訊,請參閱 湖存放庫叢集 (EC2 自動擴展群組)

叢集功能

建立叢集時,您必須選擇叢集執行的工作負載類型:串流、CDC 或混合。一般而言,最佳實務是針對串流和 CDC (資料庫和 SaaS) 來源使用獨立叢集。這可確保帳單費用準確且最低。然而,在某些使用案例中,混合工作負載是適當的,並且可以共用叢集:

  • 用於測試或評估計費量不大的小型專案。

  • 如果非串流使用量極少,且您不想設定和維護獨立叢集。

必要條件

若要建立湖存放庫叢集,您需要:

  • 目前租用戶內的網路整合。

  • 存取網路整合的權限。

建立湖存放庫叢集

若要將叢集新增至目前租用戶,請執行下列事項:

  1. 管理活動中心內,按一下湖存放庫叢集。選取湖存放庫叢集索引標籤,按一下新建,然後按一下湖存放庫叢集,並進行設定:

    • 名稱:輸入叢集的名稱。

    • 網路整合:選取將部署叢集的網路整合。

  2. 整合空間:選取叢集所屬的空間,因為這不是繼承自網路整合。

  3. 選取工作負載的叢集功能:

    • 串流工作負載:從串流資料來源擷取時選取此選項。

    • CDC 工作負載:從資料庫和 SaaS 應用程式來源擷取時選取此選項。

    • 混合工作負載:測試時選取混合工作負載,或串流來源的使用量極少,且工作負載主要由 CDC 來源組成。

  4. 設定系列類型:

    • 類型:選取執行個體類型。

    • 大小:選取執行個體大小。

  5. 設定執行個體:
    • AWS 隨選執行個體:輸入此叢集的 AWS 隨選執行個體的數量。

    • AWS Spot 執行個體:輸入要使用的最小最大 Spot 執行個體數量。

  6. 從以下選項中為您的工作負載選擇合適的策略:
    • 低成本 – 為低成本進行最佳化,雖然可能會導致偶爾有較高的延遲期間。

    • 低延遲 - 努力維持低延遲,同時允許簡短、必要的峰值。

    • 一致的低延遲 - 主動擴充以確保保持低延遲。

    • 手動擴充 - 保留執行個體的靜態數字,不含自動擴充。

  7. 選擇叢集接收軟體更新的方式:

    • 早期推出:非常適合開發和暫存叢集,以便在生產之前根據自訂設定和程式碼驗證新版本。

    • 稍後推出:更新在成功早期推出後套用,並建議用於生產環境。

  8. 為您想要包含的任何標記新增索引鍵,以協助您識別、組織和管理資源。

此頁面是否對您有幫助?

若您發現此頁面或其內容有任何問題——錯字、遺漏步驟或技術錯誤——請告知我們!