データ マート ビューの構造
このトピックでは、データ マート ビューの内部ヘッダー列 (hdr__ プレフィックスで識別可能) について説明します。データ パイプラインは、データをスター スキーマに非正規化するデータマートに集約されることが多くあります。ファクトは、軸のモデリングを使用する分析者が消費するのに便利な構造を提供します。したがって、ヘッダー列の役割を理解することで、ダウンストリーム アプリケーションによる分析と消費のための、より焦点を絞ったレポートを生成できます。
ファクト ビュー
ビュー名の形式: <DATA_ASSET_SCHEMA>.[<PREFIX>]<FACT>
次のヘッダー列がビュー構造に追加されます。
列 |
タイプ |
説明 |
---|---|---|
hdr__deleted | ブール値 |
レコードがファクト テーブルから削除されたかどうかを示します。 |
hdr_{dimension-name}_key_id | int64 |
タイプ 1 およびタイプ 2 の軸への参照。ファクト ビューには、ファクト内の軸ごとに個別の列が含まれます。 例: hdr__EMPLOYEES_key_id |
タイプ 1 の軸のビュー
ビュー名の形式: <DATA_ASSET_SCHEMA>.[<PREFIX>]<DIMENSION>
次のヘッダー列がビュー構造に追加されます。
列 |
タイプ |
説明 |
---|---|---|
hdr_{dimension-name}_key_id | int64 |
レコードごとに増加するシーケンス。 |
hdr__deleted | ブール値 |
レコードが軸テーブルから削除されたかどうかを示します。 |
タイプ 2 の軸のビュー
ビュー名の形式: <INTERNAL_SCHEMA>.[<PREFIX>]<DIMENSION>
次のヘッダー列がビュー構造に追加されます。
列 |
タイプ |
説明 |
---|---|---|
hdr_{dimension-name}_key_id |
int64 |
レコードごとに増加するシーケンス。 |
hdr__from_timestamp | 日付と時刻 |
このバージョンのレコードの、開始の日付と時刻 (UTC)。例えば、顧客が特定の住所に住み始めた日付を示す列があります。 この列では、次のことができます。
非正規化されたエンティティを含むタイプ 2 の軸の場合、これは、ストレージまたは変換データ アセット内の更新されたデータセットからの日付と時刻です。 |
hdr__to_timestamp | 日付と時刻 |
レコード バージョンの、終了の日付と時刻 (UTC)。この列は、特定のレコード バージョンの日付範囲を区切るために使用されます。例えば、顧客が特定の住所に住まなくなった日付を示す列があります。 上記の hdr_from_timestamp 列の説明も参照してください。 |
hdr__operation | varchar(1) |
フル ロード操作:
処理操作の変更 (変更テーブルを使用):
比較および適用の操作の結果として生じるアクション:
|
hdr__was_current_from_timestamp | 日付と時刻 |
最後の更新がレコードに適用されたときの日付と時刻 (UTC) を示します。 この列を hdr__was_current_to_timestamp 列と一緒に使用すると、特定の日付までのデータを、その時点でわかっていたことだけを認識して分析できます。例えば、毎日午前 2 時に前日の注文合計を計算するとします。12 月 1 日の前日の注文合計額は $1,000,000 になります。しかし、12 月 2 日に、11 月 30 日に合計 $500,000 の注文があったというレコードが挿入されています。つまり、11 月 30 日の注文額は実際には $1,500,000 でした。ただし、12 月 1 日の午前 2 時の時点に基づいて 11 月 30 日の注文の合計額のレポートを生成すると、結果は $1,000,000 のままになります。 |
hdr__was_current_to_timestamp | 日付と時刻 |
この列は、レコードが新しいレコードに置き換えられたときに入力されます。レコードが処理されたときの日付と時刻 (UTC) が表示されるため、最新のレコードではなくなります。 上記の hdr__was_current_from_timestamp 列の説明も参照してください。 |