跳到主要內容 跳至補充內容

將串流資料登陸至 Qlik 開放湖倉庫

您可以將來自串流來源的資料登陸到 Amazon S3,準備好由串流轉換任務將其轉換為 Iceberg 開放式表格格式。

將串流資料登陸到 Qlik 開放湖倉庫 需要預先設定的 Amazon S3 值區。Qlik 開放湖倉庫 專門針對大量的資料來源進行最佳化,並與所有 Qlik 支援的串流資料來源相容。如需支援的串流來源的詳細資訊,請參閱 連接資料串流

原始資料以 Avro 格式儲存在 S3 中,且串流轉換任務會將資料轉換為 Iceberg 格式。Iceberg 規格允許從任何原生支援 Trino SQL 的引擎查詢資料,例如 Amazon Athena、Ahana 或 Starburst Enterprise。或者,可以將表格鏡像到您的雲端資料倉庫,在那裡可以查詢這些內容,而無需複製資料。

準備

  • 確保您已設定 Qlik 開放湖倉庫。這包括建立網路整合、lakehouse 叢集,以及來源和目標連線。如需詳細資訊,請參閱設定 Qlik 開放湖倉庫

  • 若要將資料鏡像到您的雲端資料倉庫,您必須先建立 Qlik 開放湖倉庫 專案,以擷取您的資料,並使用 Iceberg 開放式表格格式來儲存。您可以在串流轉換任務之後新增鏡像資料任務。如需詳細資訊,請參閱將資料鏡像到雲端資料倉庫

建立串流登陸任務

若要建立串流登陸任務,請執行下列步驟以先建立專案:

  1. 建立專案,並在使用案例中選取資料管道

  2. 資料平台中選取 Qlik 開放湖倉庫,並建立與資料目錄的連線。

  3. 登陸目標連線中設定儲存區。

  4. 按一下建立以建立專案。

當您在專案中上線資料或建立登陸任務時,會建立串流登陸任務,而不是登陸任務。串流登陸任務的運作方式和行為類似於登陸任務,不同之處在於它們會將資料從串流來源登陸到雲端儲存。如需詳細資訊,請參閱連接資料串流

所有檔案均採用 Avro 格式登陸。登陸資料更新後,串流轉換任務會取用登陸資料並更新外部表格。

檢視任務資訊

按一下功能表長條上的 資訊 以檢視任務資訊,例如:

  • 擁有者

  • 空間

  • 資料平台

  • 專案 ID

  • 資料任務執行階段 ID

操作

下列作業可在串流登陸任務中使用:

  • 捨棄欄

    選取欄,然後按一下 移除

    這會新增轉換規則,在任務準備並執行後,從新載入的資料中移除該欄。您可以刪除轉換規則,藉此為新的記錄還原欄。

  • 雜湊欄,例如遮罩敏感資訊。

    在欄中選取 Hash

    這將在將輸入欄與 Hash salt string 串連後,產生該輸入欄的 SHA-256 雜湊。Hash salt string 是一個專案設定,可在 Qlik 開放湖倉庫 專案中使用。

    欄進行雜湊處理時,資料類型會變更為字串。如果您也想為特權使用者保留未雜湊的資料,請稍後在轉換任務中執行雜湊處理。

  • 篩選資料

    如需詳細資訊,請參閱篩選資料集

  • 重新命名資料集

    按一下資料集上的更多並選取重新命名

設定

如需更多關於任務設定的資訊,請參閱 串流湖登陸設定

此頁面是否對您有幫助?

若您發現此頁面或其內容有任何問題——錯字、遺漏步驟或技術錯誤——請告知我們!