メイン コンテンツをスキップする 補完的コンテンツへスキップ

数値コリレーション分析結果の検討

始める前に

数値コリレーション分析がTalend StudioProfilingパースペクティブで定義および実行されていること。

手順

  1. 分析エディターの[Analysis Results] (分析結果)ビューで、[Graphics] (グラフィック)[Simple Statistics] (シンプル統計)[Data](データ)のいずれかをクリックすると、生成されたグラフィック、分析されたレコード数、実際に分析されたデータがそれぞれ表示されます。
    [Graphics] (グラフィック)ビューの場合、バブルチャートに描かれるデータには凡例があり、データとその色が決まっています。
    「AGE対カウントの平均」のグラフィカルな結果。

    左軸近くに表示されるバブルが多くなるほど、数値カラムの平均に対する信頼性が低くなります。上の例で選択されたバブルの場合、会社名が不明でありデータレコードが2つしかないため、バブルが左軸近くに表示されています。レコードが2つだけの平均年齢は信頼できません。データクオリティに関する問題の検出時に、これらのバブルが疑わしい値を示すことがあります。

    チャートの上部や下部の近くにバブルがある場合は、データクオリティに問題があることも考えられます。上の例では、平均年齢が高すぎたり低すぎたりすることが挙げられます。

  2. 生成されたグラフから以下のアクションを実行できます。
    • バブルチャートで非表示にする値のチェックボックスをオフにします。
    • バブルにポインターを置き、その位置のコリレーションデータを表示させます。
    • バブルを右クリックし、次のオプションを選択します:
      • [Show in full screen] (全画面表示) 生成されたグラフを全画面で開きます。
      • [View rows] (行を表示): 選択されたカラムにある、分析されたすべての行にアクセスします。

タスクの結果

次の図は、選択された場所における相関するデータ値をリスト表示しているSQLエディターの例です。
SQLエディターの概要。

SQLエディターのエディターツールバーにある保存アイコンをクリックすると実行されたクエリーを保存し、[DQ Repository] (DQリポジトリー)ツリービューの[Libraries] (ライブラリー) > [Source Files] (ソースファイル)フォルダーの下にリスト表示できます。詳細は、インジケーターで実行したクエリーの保存をご覧ください。

[Simple Statistics] (シンプル統計)ビューでは、特定のカテゴリーに含まれる分析レコードの数(行数、重複を除いた一意値の数、重複値の数など)が表示されます。

[シンプル統計]インジケーターの結果を表示しているテーブルとグラフ。

[Data] (データ)ビューでは、実際に分析されたデータが表示されます。

[データ]セクションからの分析データ。

テーブルの任意のカラムヘッダーをクリックすれば、結果テーブルに表示されたデータをソートできます。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。