ロード スクリプトとチャートの数式での正規表現の使用
データ ロード スクリプトとチャートの数式で正規表現 (regex) を使用して、分析とデータ準備を強化します。正規表現は、テキストベースのデータを検索して置き換えるための、高度で柔軟かつ強力なオプションを提供します。Qlik Sense および スクリプト インターフェイスで正規表現を使用するには、利用可能なスクリプトとチャート関数を使用します。
正規表現の使い方
正規表現 (regex) は、高度なパターン マッチングのための広範なオプションを提供します。識別する特定のテキスト パターンを指定する正規表現を記述します。たとえば、自然言語の中からメール アドレスやウェブ URL の出現箇所を見つける場合などです。
正規表現の記述にはさまざまな形式があり、それぞれに独自の構文規則があります。使用可能な正規表現関数は、Perl 正規表現構文を使用します。
Qlik Sense および スクリプト インターフェイスで正規表現を使用するには、利用可能な正規表現スクリプトとチャート関数を使用します。これらの関数の使用は、正規表現の仕組みについて基本的な理解があることを前提としています。詳細および例については、「利用可能な関数と例」を参照してください。
ユース ケース
正規表現は次のような場合に使用できます。
-
複数の異なるコンテナを含むテキストから情報を抽出して分離する。例: メールアドレス、電話番号、ウェブ URL など。
-
データのフォーマットを標準化する。
-
テキストを検索および/または置換する。
利用可能な正規表現関数を使用すると、ロード スクリプトで次の操作を実行できます。
-
データを変換し、分析で使用するためにロードする。
-
データがフォーマットやその他のコンプライアンス標準に準拠していることを確認するためにデータを検証する。
-
個人を特定できる情報 (PII) を識別、マスク、または変更して、分析コンテンツの消費者に適した形式にする。
-
特定のテキスト パターンに一致するかどうかに応じて、データを選択的にアプリにロードする。
チャートの数式における正規表現関数の使用例は、ロードスクリプトの場合と似ています。チャートの数式で関数を使用すると、次のことも可能になります。
-
ユーザーのニーズとインタラクションに応じて、条件付きまたは静的にデータをオンザフライで変換する。
-
関数を使用して、ラベル、色の設定、その他のチャート固有のプロパティを定義する。
パフォーマンスに関する考慮事項
ロード スクリプトやチャートの数式で使用できる正規表現関数は、柔軟性が求められる高度な文字列変換に最適です。正規表現関数を使用すると、正規表現を使用しない場合よりも多くのリソースが消費されます。より単純なデータ変換には、文字列関数を含む他の利用可能なスクリプト関数やチャート関数の使用を検討してください。利用可能な文字列関数のリストについては、「文字列関数」を参照してください。
大容量のデータを扱う場合、n 値が大きいか負である場合の一致を検索する正規表現操作によって、パフォーマンスが低下することがあります。利用可能な正規表現関数のコンテキストでは、n の値は、occurrence 、count 、field_no のような関数の引数に対応します。