データ マートの作成と管理
データをオンボーディングしたら、ストレージまたはタスクの変換からのデータを使用してデータ マートを作成できます。ビジネス ニーズに応じて、任意の数のデータ マートを作成できます。理想的には、データ マートには、組織内の特定のセクションまたはユニット (営業部門など) で分析するために収集された要約データのリポジトリが含まれている必要があります。
前提条件
データ マートを作成する前に、以下を実施する必要があります。
- データ マートで使用する (ランディングからの) データをストレージに入力します。詳細については、「データのオンボーディング」を参照してください。
- データセット リレーショナル モデルを作成して、ソース データセット間の関係を定義します。詳細については、「 データ モデルの作成」を参照してください。
データ マートの作成
データ マートを作成するには:
-
行の最後にある
をクリックし、[開く] を選択して、データ プロジェクトを開きます。
-
以下のいずれかを行います。
- 右上の [新規ボタンの追加] をクリックし、[データ マートの作成] を選択します。
-
ストレージ アセットを見つけて、右下隅にある
アイコンをクリックします。次に [データ マートの作成] を選択します。
[データ マートの作成] ダイアログが開きます。
-
データ マートの名前を指定し、オプションで説明も指定します。
-
後でデータ マートを構成する場合は、[開く] チェック ボックスをオフにして、[作成] をクリックします。それ以外の場合は、[作成] のみをクリックします。
[データ マート] タブにデータ マートが開きます。
- ソース データの選択 の説明に従って、ソース データを選択します
- データ マートに軸を含める場合は、データ マートへの軸とファクトの追加 の説明に従って軸を追加します
- データ マートにファクトを含める場合は、ファクトの追加 の説明に従ってファクトを追加します
- データ マートに軸とファクトの両方が含まれている場合は、スター スキーマの構築 の説明に従ってスター スキーマに軸を追加します
- データ マートへの入力 の説明に従って、データ マートにデータセットを作成し、それらにデータを入力します
ソース データの選択
ストレージ データ タスク内のデータセットからソース データを選択します。
これを行うには、次の手順に従います。
-
タブの中央にある [ソース データを選択] ボタンをクリックするか、[ソース データの選択] ツールバー ボタンをクリックします。
[ソース データの選択] ダイアログが開きます。
-
変換を作成した場合は、[データ アセット] ドロップダウン リストから、ストレージ タスクまたは変換タスクを選択します。
-
規定の % のままにしてすべてのデータセットを検索するか、特定のデータセットの名前を入力して検索します。次に [検索] をクリックします。
-
目的のデータセットを選択し、[選択したテーブルの追加] をクリックします。
-
[OK] をクリックしてダイアログを閉じ、[スター スキーマの追加] または [軸の追加] に進みます。
データ マートへの軸とファクトの追加
ソース データを選択したら、データ マートの構築に進むことができます。データ マートには、ファクト データセット、軸データセット、または両方の組み合わせ (軸データセットがファクト データセットに論理的に関連付けられている場合) を含めることができます。
軸の追加
軸を追加するには。
-
[軸を追加] ボタンをクリックします。
[軸を追加] ダイアログが開きます。
-
次の設定を利用できます。
- 最も粒度の細かいデータセット: データセットを選択します。
- 名前: 軸の表示名を指定します。デフォルトは、最も粒度の細かいデータセット名です。
- 説明: オプションで、説明を入力します。
- 履歴タイプ: 次のうち 1 つを選択します:
- タイプ 1: ストレージ内の対応するレコードが更新されるたびに、軸内の既存のレコードが更新されます。
- タイプ 2: ストレージ内の対応するレコードが更新されるたびに、軸に新規レコードが追加されます。
-
非正規化するリレーションされたデータセット: 軸データセットで (ソース データ アセットモデルの関係に従って) 非正規化できるデータセットは、ここで選択できます。
非正規化できる軸の例
-
[OK] をクリックして設定を保存します。
左側の [軸] リストに軸が追加されます。
軸に関する情報の閲覧
軸を選択すると、中央のペインに [ソース リレーショナル モデル] タブが表示されます。このタブには、軸に統合されたソース データセットが表示されます。軸を追加したときに非正規化することを選択したデータセットは、選択されて表示されます (グレー表示されます)。
ファクトの追加
ファクトを追加するには:
-
[スター スキーマを追加] ボタンをクリックします。
[スター スキーマの追加] ダイアログが開きます。
-
次の設定を利用できます。
- ファクト: ファクトとなるデータセットを選択します。データセットは、作成するファクトの粒度を定義する必要があります。
- 名前: ファクトの表示名を指定します。デフォルトはファクト名です。
- 説明: オプションで、説明を入力します。
- 非正規化するリレーションされたデータセット: ファクト データセットで非正規化できるデータセットはすべて、ここで選択できます。
- 詳細設定
- 現在のデータを使用: 選択すると (既定)、ファクトにはトランザクションの日付列が含まれません。
-
トランザクションの日付を選択: 特定のトランザクション日付に従ってデータを検索するには、このオプションを選択してから、日付列を選択します。これは、スター スキーマにタイプ 2 の軸が含まれ、特定のトランザクションに対して正しいデータを見つける必要がある場合に便利です。例えば、顧客に複数の住所がある場合、注文日付に従って正しい住所を見つけることが可能かもしれません。
ユースケースの例:
ある小売業者は、注文と顧客の関係を分析するためのデータ マートを作成する必要があります。データ マートは、次のようなクエリに応答できる必要があります。2022 年第 4 四半期の注文額が最も多かったのは米国のどの州ですか?
小売業者が [現在のデータを使用] オプションを選択した場合、[顧客] テーブルの最新のレコード バージョンのみが計算に含まれます。
トランザクションの日付を無視すると、下図に示すようにデータが不正確になります。
ただし、小売業者が [トランザクションの日付を選択] オプションを選択した場合、顧客の注文は [顧客] テーブルの正しいレコード バージョンに関連付けられます。
これにより、小売業者は 2022 年第 4 四半期の州ごとの注文合計額を正確に計算できるようになります。
ヒント メモビジネス ニーズに応じて、各データ マートでトランザクションの日付を異なる方法で利用できることに注意してください。例えば、あるデータ マートでは注文日の分析に使用でき、別のデータ マートでは出荷日の分析に使用できます。
-
[OK] をクリックして設定を保存します。
ファクトは、左側のスター スキーマ リストに追加されます。
ファクトに関する情報の閲覧
ファクトを選択すると、次のタブが中央のペインに表示されます。
- スター スキーマ モデル (デフォルト): データ マート内のデータセットの関係をグラフィカルに表示します。
-
ファクト モデル: ファクト データセットに関連するデータセットを表示します。ファクトを追加したときに非正規化することを選択したデータセットは、選択されて表示されます (グレー表示されます)。
非正規化された Orders データセットを使用した Order Details ファクト - トランザクションの日付: ファクトを追加する際に、[トランザクションの日付を選択] オプションを選択した場合、トランザクション列の名前。
スター スキーマの構築
軸をデータ マートに追加したら、それらをファクト データセットに接続して、スター スキーマを作成できます。
これを行うには、次の手順に従います。
- 左側の [スター スキーマ] リストでスター スキーマを選択します。
-
右側の推奨される軸リストから、追加する軸を選択します。
推奨される軸は、ファクト データセットに点線で接続されて表示されます。
-
[適用] をクリックして軸を追加します。
軸は、ファクト データセットに実線で接続されて表示されます。
データ マートへの入力
データ マートの設計が完了したら、データ マートの作成に進むことができます。
これを行うには、次の手順に従います。
-
右上の [準備] ツールバー ボタンをクリックします。
準備プロセスには、データ マートでのデータセットとビューの作成、およびカタログの更新が含まれます。
準備が完了すると、[準備] ボタンが [実行] に変わります。
-
[実行] ボタンをクリックします。
ウィンドウがモニター ビューに切り替わり、データ マート内のデータセットの読み込みの進行状況とステータスが表示されます。
すべてのソース レコードは、削除されたレコードも含め、データ マートによって処理されます。これは、履歴情報が確実に保持されるようにするために行われます。
データ マートの管理
このセクションでは、データセットとデータ マートを管理するために使用できるさまざまなオプションについて説明します。
ファクトまたは軸の改良
[データセット] タブでは、さまざまな操作を実行して、変換ルールの作成 (列の値の置換など) や列レベルの式の追加など、ファクトと軸を調整できます。[データセット] タブは、[データ マート] タブの右側にあります。
ルールの追加
グローバル ルールを追加する方法の説明については、複数のデータセットを変換するルールの作成 を参照してください
列と式の追加
列と式を追加する方法については、データセットへの列の追加 を参照してください。
その他の管理オプション
次の表に、その他の管理オプションを示します。
範囲 (To) | 対処方法 |
---|---|
その他のソース データセットを追加 | 「ソース データの選択」を参照してください。 |
その他のファクトを追加 | 「ファクトの追加」を参照してください。 |
その他の軸を追加 | 「データ マートへの軸とファクトの追加」を参照してください。 |
軸を削除 | [軸] ペインで軸を選択し、 |
ファクトを削除 | [スター スキーマ] ペインでファクトを選択し、 |
データ マートを再作成 | 右上の |
実行中のデータ マート タスクを停止 | 右上の [停止] ボタンをクリックします。 |
データ マート タスクのスケジュール
データ マート タスクを定期的に更新するようにスケジュールできます。時間ベースのスケジュールを設定することや、入力データ タスクの実行が完了したときにタスクを実行するように設定できます。
データ タスクの [...] をクリックし、[スケジュール] を選択してスケジュールを作成します。デフォルトのスケジュール設定は、データ プロジェクトの設定から継承されます。設定の詳細については、「データ マートの既定値」を参照してください。
スケジュールを有効にするには、常に [スケジュール] を [オン] に設定する必要があります。
時間ベースのスケジュール
異なる入力ソースが更新されるタイミングに関係なく、時間ベースのスケジュールを使用してタスクを実行できます。
-
[データ タスクを実行] で、[特定の時刻] を選択します。
時間、日、週、または月単位でスケジュールを作成できます。
イベント ベースのスケジュール
イベント ベースのスケジュールを使用して、入力データ タスクの実行が完了したときにタスクを実行できます。
-
[データ タスクを実行] で、[特定のイベント発生時] を選択します。
いずれかの入力タスクが正常に完了したときにタスクを実行するか、選択した入力タスクのいずれかが正常に完了したときにタスクを実行するかを選択できます。
データ マート設定
[設定] ツールバー ボタンをクリックして、[設定: <データマート名>] ダイアログを開きます。
[一般] タブ
[一般] タブでは、次の設定を使用できます。
- データベース: データ マートが作成されるデータベース
- データ アセット スキーマ: データセットが作成されるスキーマ
- 内部スキーマ: 内部データセットが作成されるスキーマ
[ランタイム] タブ
[ランタイム] タブでは、次の設定を使用できます。
- 並列実行:Qlik Cloud がタスクのために開くことができるデータベース接続の最大数を入力します。既定値は 10 です。
- ウェアハウス: Snowflake にのみ関連します。Snowflake データ ウェアハウスの名前です。