使用 Apache Parquet 檔案
Apache Parquet 是單欄式儲存格式,對於儲存和查詢大量資料集的效率很高。在 Qlik Sense 中,您可以從 Parquet 檔案讀取資料,並將表格儲存為 Parquet 檔案。
Parquet 允許有效率地查詢表格中的特定欄,而非讀取整個表格。因此這很適合搭配大量資料處理使用。此外,Parquet 支援有效率的資料壓縮和編碼。這可以進一步減少儲存空間並改善查詢效能。
資訊備註必須手動更新在 August 2023 之前的 Qlik Sense 版本中建立的所有現存應用程式,以啟用 Parquet 支援。升級至 August 2023 的部署以及將現有應用程式匯入到新的部署時都需要這麼做。如需更多關於更新應用程式的資訊,請參閱為 Qlik Sense 的現有應用程式啟用 Parquet 檔案支援。
建立 Parquet 檔案
您可以在指令碼中使用 Store 命令建立 Parquet 檔案。在指令碼中陳述要將先前讀取的表格或部分匯出到您所選位置中明確命名的檔案。
如需詳細資訊,請參閱 Store。
從 Parquet 檔案讀取資料
您可以從 Parquet 檔案讀取資料,就像 Qlik Sense 支援的任何其他資料檔案。這包括資料管理員、資料載入編輯器或在您將資料新增至新的應用程式時。
如需詳細資訊,請參閱從檔案載入資料。
您也可以透過 LOAD 命令在資料載入指令碼中從 Parquet 檔案載入資料。例如︰
LOAD * from xyz.parquet (parquet);
如需詳細資訊,請參閱 Load。
限制
-
Qlik Sense 不支援巢狀欄位類型。會載入欄位,但內容將為 Null。
-
包含 int96 時間戳記欄位的 Parquet 檔案可能無法正確載入。
Int96 是已過時的資料類型,其中包含時間戳記而沒有時區資訊。將會嘗試以 UTC 讀取欄位,但由於有不同的廠商實作,不保證會成功。
如有需要,驗證載入的資料並透過位移調整為正確時區。