メイン コンテンツをスキップする 補完的コンテンツへスキップ

異なるテーブルにある同一カラムの比較

Talend Studioでは、2つの異なるテーブルにある同一カラムのセットを比較する分析を作成できます。この冗長性分析はデータベーステーブルにのみ対応しています。

始める前に

Profilingパースペクティブでデータベース接続が少なくとも1つ設定されていること。詳細は、データベースに接続をご覧ください。

このビューからは、実際に分析されたデータにデータエクスプローラー経由でアクセスすることもできます。

分析されたデータ行にアクセスするには、テーブルのいずれかの行を右クリックし、実行するアクションを選択します:
  • [View match rows] (一致する行を表示): 2つの同一カラムセットで一致する可能性があるすべての行のリストにアクセスします。
  • [View not match rows] (一致しない行を表示): 2つの同一カラムセットで一致しない可能性があるすべての行のリストにアクセスします。
  • [View rows] (行を表示): 2つの同一カラムセットのすべての行のリストにアクセスします。
情報メモ警告: データエクスプローラーでは、ユーザー名が空白である接続(MS SQL Serverのシングルサインオンなど)はサポートされていません。そのような接続を使ってデータを分析し、Data Explorerパースペクティブでデータ行を表示しようとすると、警告メッセージが表示され、SQL Serverへの接続認証情報を設定するよう求められます。

次の表は、2つの同一カラムセットで一致するすべての行をデータエクスプローラーでリスト表示したもので、この例には8件あります。

2つのセットで一致する行の数。

SQLエディターのエディターツールバーにある保存アイコンをクリックすると実行されたクエリーを保存し、[DQ Repository] (DQリポジトリー)ツリービューの[Libraries] (ライブラリー) > [Source Files] (ソースファイル)フォルダーの下にリスト表示できます。詳細は、インジケーターで実行したクエリーの保存をご覧ください。

次の表は、2つの同一カラムセットで一致しないすべての行をデータエクスプローラーでリスト表示したもので、この例には3件あります。

2つのセットで一致する行の数。

冗長性分析を定義

Procedure

  1. [DQ Repository] (DQリポジトリー)ツリービューで、[Data Profiling] (データプロファイリング)を展開します。
  2. [Analyses] (分析)フォルダーを右クリックし、[New Analysis] (新しい分析)を選択します。
    Analysesノードのコンテキストメニュー。
    [Create New Analysis] (新しい分析を作成)ウィザードが開きます。
  3. フィルターフィールドで、redundancy analysisの最初の数文字を入力して、リストから[Redundancy Analysis] (冗長性分析)を選択し、[Next] (次へ)をクリックします。
  4. [Name] (名前)フィールドに、現在の分析の名前を入力します。
    情報メモImportant:

    ~ ! ` # ^ * & \\ / ? : ; \ , . ( ) ¥ ' " " " < > といった特殊文字は項目名に使用しないでください。

    ファイルシステムでは、これらの文字はすべて"_"に置き換えられ、重複する項目が作成されてしまう場合があります。

  5. 該当するフィールドで、分析メタデータ(目的、説明、作成者)を設定して[Finish] (終了)をクリックします。

比較する同一カラムの選択

Procedure

  1. [DB connections] (データベース接続)を展開し、目的のデータベースで、分析するカラムを参照して選択し、[Finish] (終了)をクリックしてウィザードを閉じます。
    新規作成された分析用のファイルが、[DQ Repository] (DQリポジトリー)ツリービュー内の[Analysis] (分析)フォルダーの下にリスト表示されます。定義された分析メタデータと共に分析エディターが開きます。
    [分析結果]タブにある[分析メタデータ]セクションの概要。
    分析エディターの表示は、[Preferences] (環境設定)ウィンドウで設定したパラメーターによって異なります。詳細は、分析エディターと分析結果の環境設定をご覧ください。
  2. [Analyzed Column Sets] (分析済みカラムセット)をクリックしてビューを表示させ、カラムを設定するか、選択したカラムを変更します。
    この例では、[account]テーブルと[account_back]テーブルにある同一カラムを比較します。
    [分析設定]タブにある[分析カラムセット]セクションの概要。
  3. [Connection] (接続)リストで、接続するデータベースに対して適切なデータベース接続を選択します。
    Talend Studioリポジトリーで作成し、一元管理するすべてのデータベース接続が、このリストに含まれています。
  4. [A column Set] (Aセットのカラム)をクリックし、[Column Selection] (カラム選択)ダイアログボックスを開きます。
  5. データベース接続内のカタログ/スキーマを参照して、分析するカラムが含まれているテーブルに移動します。
    [Table filter] (テーブルフィルター)フィールドや[Column filter] (カラムフィルター)フィールドに必要なテキストを入力すると、テーブルやカラムのリストをフィルタリングできます。リストには、入力したテキストに対応するテーブルまたはカラムのみ表示されます。
  6. テーブル名をクリックし、含まれているカラムをすべて[Column Selection] (カラム選択)ダイアログボックスの右にあるパネルにリスト表示します。
  7. 右側のリストで、分析するカラムのチェックボックスをオンにしてOKをクリックし、次のステップに進みます。
    分析するカラムの選択。
    分析するカラムは[DQ Repository] (DQリポジトリー)ツリービューからエディターに直接ドラッグできます。
    [Analyzed Columns] (分析済みカラム)ビューにリスト表示されているいずれかのカラムを右クリックして[Show in DQ Repository view] (DQリポジトリービューで表示)を選択すると、選択されたカラムがツリービューの対応する接続の下へ自動的に配置されます。
  8. [B Column Set] (Bセットのカラム)をクリックし、同じステップで2番目のカラムのセットを選択するか、右のカラムパネルにドラッグします。
  9. AセットのデータをBセットのデータと一致させたい(その逆ではない)場合は、[Compute only number of A rows not in B] (B行ではなくA行の数のみ計算)チェックボックスをオンにします。
  10. マッチング時にNULL値を無視する場合は、[Ignore Null] (NULLを無視)チェックボックスを選択します。

分析を確定および実行

Procedure

  1. [Data Filter] (データフィルター)ビューで、必要に応じて、SQL WHERE句を入力し、分析を実行するデータをフィルター処理します。
  2. 必要に応じて、[Analysis Parameter] (分析パラメーター)ビューの[Number of connections per analysis] (分析ごとの接続数)フィールドで、選択されたデータベースに対して許可する分析ごとの同時接続数を設定します。
    この数値はデータベースの利用可能リソース、つまりデータベースがサポートできる同時接続数に基づいて設定します。
  3. 分析エディターの[Context] (コンテキスト)ビューでコンテキスト変数を定義した場合は、次のステップに従います。
    1. [Data Filter] (データフィルター)ビューおよび[Analysis Parameter] (分析パラメーター)ビューを使用して、データをフィルター処理するためのコンテキスト変数を設定/選択し、それぞれの分析ごとの同時接続数を決定します。
    2. [Context Settings] (コンテキスト設定)ビューで、リストから、分析を実行するために使用するコンテキスト環境を選択します。
    コンテキストと変数の詳細は、分析でのコンテキスト変数の使用方法をご覧ください。
  4. 分析を保存し、F6を押して実行します。
    確認のメッセージが表示されます。
  5. 操作を続行する場合はOKをクリックします。

Results

[Analysis Results] (分析結果)ビューが開き、分析結果が表示されます。

この例では、[account]テーブルのカラムに存在するデータの72.73%が[account_back]テーブルのカラムに存在する同じデータと一致しています。

[分析結果]セクションでの分析の結果。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。