メイン コンテンツをスキップする 補完的コンテンツへスキップ

Talend Trust Scoreを改善

次の例は、Talend Cloud Data InventoryTalend Cloud Data Preparationを使ってTalend Trust Scoreを改善する方法です。

この例では、あなたはeコマース企業に勤務しています。まだ出荷されていない注文がいくつかあります。注文の進捗状況を調べているうちに、一部の国名と納税者番号が間違っていることに気づきました。

データセットのサンプルは次のとおりです。
eコマース企業の情報が含まれているデータセットのサンプル。

実際のTalend Trust Scoreをチェック

手順

  1. [Datasets] (データセット)タブに移動します。
  2. Talend Trust Scoreを改善させたいデータセットを見つけるためには、データセットをフィルタリングします。
    [フィルターを追加]オプションが選択されている状態。
  3. この例では、タグを使ってデータセットをフィルタリングします。
    データセットをフィルタリングするために選択されたin ordersタグ。
    データセッリストがフィルタリングされます。Talend Trust Scoreは3.38/5です。

次のタスク

Talend Trust Scoreを改善させるためには、このデータセットからプレパレーションを作成します。 データセットからプレパレーションを作成をご覧ください。

プレパレーションの詳細は、Talend Cloud Data Preparationユーザーガイドをご覧ください。

データセットからプレパレーションを作成

手順

  1. Talend Cloud Data Inventoryで、[Datasets] (データセット)タブに移動します。
    前のセクションで適用されたフィルターに従って、データセットリストがフィルタリングされます。
  2. データセットにカーソルを起き、[Preparations] (プレパレーション)アイコンをクリックします。
    [プレパレーション]アイコンが選択されている状態。
    [Preparations] (プレパレーション)ウィザードが開きます。
  3. [Add] (追加)をクリックします。
    Talend Cloud Data Preparationにリダイレクトされ、プレパレーションが作成されます。

次のタスク

これでプレパレーションを設定できるようになります。

プレパレーションを設定

このタスクについて

この例では、Talend Cloud Data Preparationからのファンクションを使います。

手順

  1. 国名を修正する場合は、ファジーマッチングファンクションを使います。
    1. delivery_countryというカラムを選択します。
    2. 右パネルで[Column] (カラム)を選択し、fuzzy matchingと入力します。
    3. [Standardize value (fuzzy matching)] (値を標準化(ファジーマッチング))というファンクションを選択します。
    4. [Match threshold] (マッチングしきい値)[Default (> 80%)] (デフォルト(> 80%))に設定します。
    5. [Submit] (送信)をクリックします。左パネルのプレパレーションステップにステップが追加され、国名が修正されます。たとえばUnited Staatesは、United Statesに置き換えられます。
  2. 国コードを変換する場合は、変換ファンクションを使います。delivery_countryカラムは選択されたままとなります。
    1. 右パネルで[Column] (カラム)を選択し、convertと入力します。
    2. [Convert country names and codes] (国名とコードを変換)というファンクションを選択します。
    3. [From] (変換前)[ISO country code] (ISO国コード)に、[To] (変換後)[English country name] (英語の国名)にそれぞれ設定します。
    4. [Submit] (送信)をクリックします。国名が変換されます。たとえばCAは、Canadaに置き換えられます。
  3. TINを修正する場合は、ルックアップ機能を使います。
    これによって現在のプレパレーションのデータを参照データセットとマッチングさせることができます。詳細については、別のデータセットのデータを動的に使用をご覧ください。
    マッチングカラムを関連付ける必要があります。
    1. customer_idというカラムを選択します。この例では、このカラムがマッチングカラムです。
    2. 右パネルの上にあるルックアップアイコンをクリックします。
      [Lookup] (ルックアップ)アイコンが選択されている状態。
      [Lookup] (ルックアップ)パネルが右パネルとして開きます。
    3. [Select dataset] (データセットを選択)をクリックします。
    4. 参照データセットを選択して[Select] (選択)をクリックします。[Lookup] (ルックアップ)パネルに戻り、プレパレーションの下に参照データセットが表示されます。
      ルックアップパネルでプレパレーションの下に参照データセットが表示されている状態。
    5. [Current preparation] (現在のプレパレーション)[Lookup dataset] (ルックアップデータセット)で、customer_idを選択します。
    6. プレパレーションに追加するカラムを参照データセットから選択します。
      この例では、TIN を修正したいとします。customer_tax_idを選択する必要があります。
      [カラムをインポート]オプションからcustomer_tax_idが選択されている状態。
    7. [Submit] (送信)をクリックします。左パネルのプレパレーションステップにステップが追加されます。

プレパレーションを実行

手順

  1. [Run] (実行)をクリックします。
  2. 準備されたデータを出力するため、現在のデータセットを選択します。
    データセットが選択されると、[Additional parameters] (追加パラメーター)が表示されます。
  3. [Action] (アクション)として[Update] (アップデート)を選択します。
  4. [Operation keys] (オペレーションキー)order_idと入力します。
  5. (Create entry) (新規作成)を選択し、[Next] (次へ)をクリックします。
    [オペレーションキー]ドロップダウンリストがにorder_idが表示されている状態。
  6. customer_tax_idcustomer_tinをマッピングさせます。
    customer_tax_id mappedとcustom_tinがマッピングされている状態。

    プレパレーションにあるカラムが参照データセットより多い場合は、一部のカラムをマッピングしないままにしておくことができます。

  7. [Next] (次へ)をクリックします。
  8. 実行プロファイルを選択し、[Run] (実行)をクリックします。
    プレパレーションの実行には数分かかることがあります。実行の進捗は、右パネルの上にある[Run history] (実行履歴)で確認できます。
    [実行履歴]ボタンがクリックされた状態。
  9. データセットが改善されたことを確認する場合は、Talend Cloud Data Inventoryに戻ります。

新しいTalend Trust Scoreをチェック

手順

  1. プレパレーションの改善項目を確認するためには、データセットを開き、[Sample] (サンプル)ビューからサンプルをアップデートします。
    [Head sample] (ヘッドサンプル)ビュー内の[Refresh] (更新)ボタン。
    国名がすべて正しく、一部のTIN (納税者番号)も入力されているのがわかります。
  2. データセットクオリティへの影響を確認するためには、データセットの概要に移動します。
    Talend Trust Scoreが3.38/5から3.57/5に上昇しました。
    3.57/5のTalend Trust Scoreを示した図。

次のタスク

データクオリティルールはTalend Trust Scoreの改善にも役立ちます。詳細は、 データクオリティルールを管理をご覧ください。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。