アプリケーションを Qlik Answers 用に準備するためのベスト プラクティス
Qlik Answers はあらゆるアプリケーションで使用できますが、Qlik Answers 用にアプリケーションを準備する時間をかけることで、回答の質が向上します。
Qlik Answers から良好な結果を得るには、明確さとコンテキストがもっとも重要な要素になります。明確であれば、Qlik Answers はアプリケーション内のデータを容易に理解できます。コンテキストがあれば、Qlik Answers はアプリケーション内のデータを解釈し、正しく使用できます。アプリケーションを準備する際に、次のベスト プラクティスに従うことで、データの明確さとコンテキストの質が向上します。
-
明確かつ説明的な項目名を使用する
-
データ モデルを合理化する
-
項目のデータ形式を確認する
-
マスター アイテムを使用する
-
ビジネス ロジックの語彙を使用して用語を追加する
-
データ モデルから不要な項目を削除する
明確かつ説明的な項目名を使用する
データ モデルでは、明確かつ説明的な項目名を使用する必要があります。項目名は次のようにしてください。
-
各項目のビジネス上の意味を明確にする。
-
他の項目との違いや類似点を明確に示す、ビジネスに即した明確な名前を付ける。
次のベスト プラクティスは、項目とその用途を明確にするのに役立ちます。
-
「CUST_NM」ではなく、「Customer Name」のような完全な表記を使用する。こうすることで、自然言語での質問と項目の関連性を高めることができます。
-
項目名にコンテキストを補足する修飾語を付けることで、項目間のあいまいさを解消する。例:
-
場所を明確にする。「City」という同じ名前の 2 つの項目ではなく、「Customer City」と「Store City」などを使用してください。
-
日付/時刻を明確にする。「Date」という同じ名前の 2 つの項目ではなく、「Order Date」と「Shipment Date」などを使用してください。
-
項目の役割とタイプを示すようにする。count (件数)、total (合計)、amount (量)、percentage (割合) などの単語を組み込み、項目の集計特性を明確にします。例: Order Count。項目名にブール値を使用する場合は、is_active または has_churned などのプレフィックスを使用するなど、前置詞として読み取れる名前にしてください。
-
キー項目には、コンテキストを含んだプレフィックスを付ける。たとえば、ID または cust_ref などの汎用項目よりも、customer_id や order_id などを使用することをお勧めします。
次のような項目名は使用しないでください。
-
不透明なコードや専門用語を使用する。
-
ブール値項目には、項目の解釈を妨げる可能性があるため、「Flag」または「Active」などの形容詞のみを使用する。
-
コンテキストが含まれない曖昧な名詞や一般的な名詞を使用する。たとえば、「Amount」という項目では、それが何の金額であるかが伝わりません。汎用項目が複数あると、自然言語クエリを適切な項目に確実にマッピングすることが困難になる可能性があります。
-
顧客番号を「cust_no」、トランザクションを「txn」など、難解な略語を使用する。これらにより、項目の理解が困難になります。
データ モデルを合理化する
不要な項目を削除してデータ モデルを合理化することで、より正確で予測可能な回答が得られます。厳選された項目を選択することで、誤った項目選択や混乱の可能性が軽減されます。合理化されたデータ モデルでは、インデックス作成も高速になります。データ モデルを合理化するには、次を実行します。
-
技術的な項目を非表示にします。
-
冗長な項目やほぼ重複する項目を、単一の信頼できるバージョンに統合します。
技術的な項目を非表示にする
データ モデルは、Qlik Answers に真の分析的価値を含む項目を提供する必要があります。Qlik Answers がアプリケーションを理解する上で役立たない技術的な項目を含めることは避けてください。技術的な項目には、次のような情報が含まれます。
-
ID
-
キー
-
ロード タイムスタンプ
-
ステージング列
不要な項目は非表示にすることで削除できます。非表示の項目は、スクリプト ロジックまたは内部計算には引き続き使用できますが、Qlik Answers の分析からは除外されます。
-
ロード スクリプトまたはデータ マネージャーで、名前に % プレフィックスを追加します (例: %Discount2)。
-
ビジネス ロジックの論理モデルで、表示設定を [非表示] にします。
詳細については、「可視性」を参照してください。
項目の統合と名前変更
冗長な項目やほぼ重複する項目を、単一の信頼できるバージョンに統合します。あいまいな項目があると、データを正しく解釈することが困難になります。
データ モデルをできるだけ明確で理解しやすいものにするために、項目の名前を変更または統合します。
例: あいまいな項目を修正してデータ モデルを合理化する
データ モデルの次の項目名について考えてみましょう。
-
Discount_Amount
-
Discount_Value
-
Discount1
-
Discount2
これらの項目名は、Qlik Answers が解釈する際にいくつかの問題を引き起こします。
-
複数の項目が discount という用語を競合するため、Qlik Answers であいまいな解釈が生じます。
-
数値サフィックス (1、2) およびあいまいな項目名は、明確なビジネス上の意味を提供しません。
-
複数の命名規則が混在していると、明確さが低下します。
これらの問題を解決するには、Qlik Answers で使用するアプリケーションを準備する際に、項目名を変更する必要があります。項目が異なる概念を表している場合は、用途と目的を明確に示すように名前を変更してください。例:
-
Product Discount
-
Promotional Discount
-
Coupon Discount
-
Loyalty Discount
同じ概念を表す場合は、「Discount Amount」のような単一の信頼できる項目に統合する必要があります。これらの項目が技術的なものやレガシーなものである場合は、非表示にする必要があります。
プレーン テキストとしてロードされた日付/時刻項目の書式設定
一部の項目には日付/時刻情報が含まれていますが、データ モデルではプレーン テキストとしてロードされます。これらの項目は日付/時刻項目ではなくテキスト項目として分類されるため、真の日付項目として扱われず、Qlik Answers の分析では正しく使用されません。
日付/時刻情報を含む項目がテキストとしてタグ付けまたは保存されている場合は、ロード時にデータ マネージャーのツールまたはロード スクリプトの日付関数を使用して、適切な形式に変換してください。これにより、次が保証されます。
-
項目が日付を含むものとして認識されます。
-
自動カレンダー生成が機能します。
-
ユーザーからの時刻に関する質問が日付/時刻項目に正しくマッピングされます。
-
ソートとフィルタリングが正しく機能します。
マスター アイテムを使用する
マスター アイテムは、Qlik Answers がアプリケーション データを解釈する能力を向上させます。質問を解釈する際、Qlik Answers は、ユーザーが作成したデータ モデル内の項目よりもマスター アイテムを重視します。マスター アイテムは、Qlik Answers がアプリケーション データをより正確に解釈するのに役立ちます。質問を処理する際、Qlik Answers は、マスター アイテムがユーザー定義のセマンティクスとビジネス インテントを表すため、データ モデル内の生の項目よりもマスター アイテムを重視します。これにより、Qlik Answers は、基盤となる技術的な項目よりもキュレーションされた定義を優先できます。
マスター アイテムは、データ モデル内の各重要なメトリクスまたは項目の単一の信頼できるバージョンを作成することで、明確さを高め、あいまいさを軽減します。これはユーザー間で類似の回答の整合性を保つのにも役立ちます。たとえば、「利益率」について質問され、対応するマスター メジャーがある場合、質問者が誰で、どのように質問されたかに関係なく、回答は同じ定義に基づきます。
マスター アイテムのもっとも重要な要素の 1 つは、説明です。Qlik Answers は、説明を使用して、マスター アイテムを解釈するためのコンテキストを提供します。マスター アイテムの効果的な説明により、以下の点が明確になります。
-
意図
-
意味
-
ビジネス コンテキスト
マスター アイテムの説明により、Qlik Answers がマスター軸またはメジャーを理解し、ユーザーが予期しない方法で質問した場合でも適切なメトリクスを選択しやすくなります。
マスター アイテムと Qlik Answers に関するその他のベスト プラクティスについては、「Qlik Answers のマスター アイテムの説明の作成」を参照してください。
効果的なマスター アイテムの説明
マスター メジャー: 顧客獲得コスト
説明: 新規顧客獲得にかかる平均コスト。マーケティングおよび営業費用の合計を新規獲得顧客数で割って算出されます。維持費または更新費は含まれません。CAC とも呼ばれます。
ビジネス ロジックの同義語を活用して価値を高める
ビジネス ロジックの同義語は、Qlik Answers による用語の解釈方法を改善するのに役立ちます。Qlik Answers は一般的なビジネス言語を理解しますが、データ モデルには LLM が自然に認識または正しく解釈できない用語が含まれている場合があります。同義語は、Qlik Answers が組織のデータに固有の用語を理解するのに役立ちます。以下のカテゴリの用語は、同義語を追加すると効果的です。
-
組織固有の専門用語または頭字語
-
社内の KPI のニックネーム
-
ビジネス用語としても使用される製品コードまたはプロセス コード
-
類似しているように見えるが、社内では異なる定義を持つメトリクス
-
業界外では広く使われていないドメイン固有の言語
次のような同義語は避けてください。
-
「top」や「bottom」などの用語を含むもの。多くの場合、詳細があいまいで、複数の解釈が可能であるためです。たとえば、「top 5」は、収益、取引数、割合、または絶対順位による上位を指す可能性があります。より正確な同義語を使用することで、一貫した解釈が保証されます。
項目の値と重複する同義語を追加すると、あいまいさが生じる可能性があります。
-
既存の項目値と重複するもの。あいまいさが生じる可能性があります。
-
複数の項目に同じ同義語を割り当てること。たとえば、2 つの異なるメジャーに「sales」を使用するなどです。どの項目を使用すべきかが不明確になります。
-
ストップ ワードが含まれるもの。質問処理中に無視され、質問が受け入れられなくなる可能性があります。
詳細については、「同義語の追加」を参照してください。