データセットの管理
ランディング、ストレージ、変換およびデータ マートのデータ タスクに含まれるデータセットを管理して、変換の作成、データのフィルタリング、列の追加ができます。
含まれるデータセットは、 [デザイン] ビューの [データセット] の下に表示されます。
データ タスクの [デザイン] ビューの [データセット]


変換ルールと明示的な変換
グローバル変換と明示的な変換の両方を実行できます。
変換ルール
グローバル変換は、スコープにワイルド カードとして% を使用し、一致するすべてのデータセットに適用する変換ルールを作成することにより実行できます。
-
[ルール]、 [ルールを追加] の順にクリックして、新しい変換ルールを作成します。
詳細については、「複数のデータセットを変換するルールの作成」を参照してください。
変換ルールは、影響を受ける属性の角が濃い紫色で示されます。
明示的な変換
明示的な変換は、次のときに作成されます。
-
[編集] を使用して列の属性を変更するとき
-
データセットで [名前の変更] を使用するとき。
-
列を追加するとき。
明示的な変換は、グローバル変換を上書きし、影響を受ける属性の角が薄い紫色で示されます。
データセットのフィルタリング
必要に応じて、データをフィルタリングして行のサブセットを作成できます。
-
[フィルター] をクリックします
詳細については、「データセットのフィルタリング」を参照してください。
データセットの名前の変更
データセットの名前を変更できます。
-
データセットで
をクリックしてから、 [名前を変更] をクリックします。
列の追加
必要に応じて、行レベルの変換で列を追加できます。
-
[列を追加] をクリックします
詳細については、「データセットへの列の追加」を参照してください。
列の編集
列を選択して [編集] をクリックすると、列のプロパティを編集できます。
-
名前
-
キー
主キーとなる列を設定します。[キー] 列で選択または選択解除して、キーを設定することもできます。
-
Null 可能
-
データ型
列のデータ型を設定します。一部のデータ型では、 [長さ] などの追加のプロパティを設定できます。
列の削除
データセットから 1 つまたは複数の列を削除できます。
-
削除する列を選択し、 [削除] をクリックします。
削除された列を表示するには、 [削除された列を表示] をクリックします。削除された列は、取り消し線付きのテキストで示されます。削除された列を選択し、 [元に戻す] をクリックすると、削除された列を復元できます。
列への明示的な変更を元に戻す
1 つまたは複数の列に対する、すべての明示的な変更を元に戻すことができます。
-
変更を元に戻す列を選択し、 [元に戻す] をクリックします。
グローバル変換ルールからの変更は元に戻すことができません。
追加した列を元に戻すと、その列は削除されます。
データセットの設定
データセットの設定を変更できます。既定の設定ではデータ アセットの設定を継承しますが、設定を明示的にオンまたはオフに変更することもできます。
-
データセットで
をクリックしてから、 [設定] をクリックします。
データセットの検証と調整
データ タスクに含まれるすべてのデータセットを検証できます。
[Validate and adjust (検証と調整)] を展開して、すべての検証エラーと設計変更を確認します。
データセットの検証
-
[データセットを検証する] をクリックして、データセットを検証します。
検証には、次のチェックが含まれます。
-
すべてのテーブルに主キーがあること
-
不足している属性がないこと。
-
重複するテーブル名または列名がないこと。
ソースと比較した設計変更のリストも表示されます。
-
追加されたテーブルと列
-
削除されたテーブルと列
-
名前が変更されたテーブルと列
-
変更された主キーとデータ型
[Validate and adjust (検証と調整)] を展開して、すべての検証エラーと設計変更を確認します。
-
検証エラーを修正してから、データ セットを再度検証します。
-
主キーやデータ型の変更を除いて、ほとんどの設計変更は自動的に調整できます。その場合には、データセットを同期する必要があります。
データセットの準備
可能な場合は、データを損失することなくデータセットを準備して設計変更を調整できます。データを損失することなく設計変更を調整できない場合は、データの損失ありでソースからテーブルを再作成するかどうかを選択するオプションが表示されます。
これには、タスクを停止する必要があります。
-
、[準備] の順番でクリックします。
データセットが準備されたら、ストレージ タスクを再開する前にデータセットを検証します。
データセットの再作成
ソースからデータセットを再作成することができます。データセットを再作成する際には、データ アセットにデータ損失があります。ソース データがある限り、ソースデータをソースからリロードすることができます。
これには、タスクを停止する必要があります。
-
をクリックしてから、 [再作成] をクリックします。
制限事項
-
Google BigQuery では、列を削除または名前を変更すると、テーブルが再作成され、データが失われます。