跳到主要內容 跳至補充內容

將串流資料登陸至 Qlik 開放湖倉庫

資料在 Amazon S3 中登陸,準備好由串流轉換任務轉換為 Iceberg 開放式表格格式。您可以從 Qlik 支援的任何串流來源登陸資料。

將串流資料登陸到 Qlik 開放湖倉庫 需要預先設定的 Amazon S3 值區。Qlik 開放湖倉庫 專門針對大量的資料來源進行最佳化,並與所有 Qlik 支援的串流資料來源相容。如需支援的串流來源的詳細資訊,請參閱「連線至資料串流」。

原始資料以 Avro 格式儲存在 S3 中,且串流轉換任務會將資料轉換為 Iceberg 格式。Iceberg 規格允許從任何原生支援 Trino SQL 的引擎查詢資料,例如 Amazon Athena、Ahana 或 Starburst Enterprise。或者,可以將表格鏡像到您的雲端資料倉庫,在那裡可以查詢這些內容,而無需複製資料。

在具有 AWS Glue 資料目錄目標連線的專案中,可以將資料登陸到 Qlik 開放湖倉庫

準備

  • 執行擷取需要儲存湖倉叢集,且必須在建立專案之前進行設定。

  • 雖然您可以在設定精靈中設定來源和目標連線設定,但為了簡化設定程序,建議在建立任務之前就這麼做。

  • 若要將資料鏡像到您的雲端資料倉庫,您必須先建立 Qlik 開放湖倉庫 專案,以擷取您的資料,並使用 Iceberg 開放式表格格式來儲存。您可以在串流轉換任務之後新增鏡像資料任務。如需詳細資訊,請參閱將資料鏡像到雲端資料倉庫

建立串流登陸任務

若要建立串流登陸任務,請執行下列步驟以先建立專案:

  1. 建立專案,並在使用案例中選取資料管道

  2. 資料平台中選取 Qlik 開放湖倉庫,並建立與資料目錄的連線。

  3. 登陸目標連線中設定儲存區。

  4. 選取 儲存資料湖叢集 以執行資料擷取和最佳化。

  5. 按一下建立以建立專案。

當您在專案中上線資料或建立登陸任務時,會建立串流登陸任務,而不是登陸任務。串流登陸任務的運作方式和行為類似於登陸任務,不同之處在於它們會將資料從串流來源登陸到雲端儲存。如需詳細資訊,請參閱連接資料串流

所有檔案均採用 Avro 格式登陸。登陸資料更新後,串流轉換任務會取用登陸資料並更新外部表格。

設定

如需更多關於任務設定的資訊,請參閱 串流湖登陸設定

此頁面是否對您有幫助?

若您發現此頁面或其內容有任何問題——錯字、遺漏步驟或技術錯誤——請告知我們!