Apache Parquet ファイルでの作業

Apache Parquet は、大きいデータセットの保存とクエリに非常に効率的な列型ストレージフォーマットです。Qlik Sense では、Parquet ファイルからのデータを読み込み、Parquetファイルとしてテーブルを保存できます。

Parquet を使用すると、テーブル全体を読み込むのではなく、テーブル内の特定の列を効率的にクエリできます。これは、大きなデータの処理に適しています。また、Parquet はデータの効率的な圧縮とエンコーディングをサポートします。これにより、さらにストレージスペースを削減して、クエリパフォーマンスを改善できます。

August 2023より前の Qlik Sense のバージョンで作成されたすべての既存のアプリは、Parquet のサポートを有効にするために手動で更新する必要があります。これは、August 2023 にアップグレードする展開と、既存のアプリを新しい展開にインポートする場合の両方で必要になります。アプリの更新の詳細については、「Qlik Sense で既存のアプリに対する Parquet ファイルのサポートを有効にする」を参照してください。

Parquet ファイルの作成

スクリプトで Store コマンドを使用して Parquet ファイルを作成できます。スクリプトで、以前に読み取ったテーブルまたはその一部を、選択した場所にある明示的に指定されたファイルにエクスポートするように記述します。

詳細については、「Store」を参照してください。

Parquet ファイルからのデータのロード

Parquet ファイルからのデータを、Qlik Sense でサポートされているその他のデータと同様に読み込むことができます。これには、データマネージャー、データロードエディター、またはデータを新しいアプリに追加するタイミングが含まれます。

詳細については、「ファイルからのデータのロード」を参照してください。

また、LOAD コマンドを使って、Parquet ファイルからのデータをデータロードスクリプトにロードできます。例:

LOAD * from xyz.parquet (parquet);

詳細については、「 Load」を参照してください。

制限事項

ネストされた項目タイプは Qlik Sense によってサポートされていません。項目がロードされても、コンテンツは null です。
int96 タイムスタンプフィールドを含む Parquet ファイルは、正しくロードされない可能性があります。

Int96 は、タイムゾーン情報を含まないタイムスタンプを含む非推奨のデータ型です。フィールドを UTC として読み込むよう試行されますが、異なるベンダー実装があるため、成功は保証されません。

ロードされたデータを検証して、必要に応じてオフセットを使い、正しいタイムゾーンに合わせて調整します。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。

こちらにフィードバックをお寄せください