メイン コンテンツをスキップする 補完的コンテンツへスキップ

Icebergブランチからのデータをアップデートおよび読み取り

このシナリオの第2ステップは、新しく作成されたIcebergブランチからデータをアップデートすることです。続いて、メインのIcebergテーブルとIcebergブランチの両方で同じクエリーの結果を比較することでアップデートを確認できます。

このタスクについて

このタスクでは、Update branchRead from main branchRead from cleaned branchというサブジョブが使用されます。

手順

  1. Update branchあるtIcebergRowの[Basic settings] (基本設定)ビューから、次のようにパラメーターを設定します:
    tIcebergRowの[Basic settings] (基本設定)ビュー。
    1. [Connection] (接続)ドロップダウンリストから、使用する接続コンポーネントを選択します。この例では、tIcebergConnection_1です。
    2. [Sql query] (SQLクエリー)フィールドで、実行するSQLクエリーを入力します。この例では、"UPDATE default.marketing_toclean.branch_cleaned_data SET membership_type=null where (last_purchase_date > 40 or total_spend < 450) and membership_type='Bronze'"です。これによって、450ドル未満または40日間未購入の顧客のブロンズメンバーシップを剥奪できるようになります。
    情報メモヒント: Icebergブランチでクエリーを行う場合、構文はdefault.nameoftheoriginaltable.branch_branchnameとなります。
  2. [Run] (実行)タブの[Run] (実行)ボタンをクリックし、Update branchサブジョブを実行します。
    marketing_tocleanブランチでデータがアップデートされます。
  3. Read from main branchサブジョブにあるtIcebergInputの[Basic settings] (基本設定)ビューから、次のようにパラメーターを設定します:
    tIcebergInputの[Basic settings] (基本設定)ビュー。
    1. [Property Type] (プロパティタイプ)ドロップダウンリストで、データを格納する場所を選択します。この例では、Built-inです。
    2. [Sql query] (SQLクエリー)フィールドで、実行するSQLクエリーを入力します。この例では、"SELECT * FROM marketing_toclean WHERE membership_type='Bronze'"です。これによって、marketing_toclean Icebergテーブルでブロンズメンバーシップを持つ顧客のみを選択できるようになります。
    3. [Connection] (接続)ドロップダウンリストから、使用する接続コンポーネントを選択します。この例では、tIcebergConnection_1です。
    4. 他のパラメーターはそのままにしておきます。
  4. Read from main branchサブジョブにあるtLogRowの[Basic settings] (基本設定)ビューから、次のようにパラメーターを設定します:
    tLogRowの[Basic settings] (基本設定)ビュー。
    1. [Mode] (モード)セクションで[Basic] (基本)オプションを選択します。
    2. [Field Separator] (フィールド区切り)フィールドに、ログ表示でデータを区切るセパレーターを入力します。この例では、"|"です。
    3. 他のパラメーターはそのままにしておきます。
  5. Read from cleaned branchサブジョブでステップ3と4を繰り返し、branch_cleaned Icebergブランチからデータを読み取ります。tIcebergInputのSQLクエリーを次のように変更するだけで結構です: "SELECT * FROM default.marketing_toclean.branch_cleaned_data WHERE membership_type='Bronze'"
  6. [Run] (実行)タブの[Run] (実行)ボタンをクリックし、Read from main branchサブジョブとRead from cleaned branchサブジョブを実行します。
    結果は、ジョブの[Execution] (実行)コンソールに表示されます。

タスクの結果

これで、marketing_toclean Icebergテーブルの結果である116と、cleaned_data Icebergブランチの結果である66を比較できます。このように結果が異なるということは、cleaned_dataブランチでデータが適切にアップデートされていることを表します。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。