メイン コンテンツをスキップする 補完的コンテンツへスキップ

数値コリレーション分析を作成

始める前に

Profilingパースペクティブでデータベース接続が作成されていること。

このタスクについて

次の例では、さまざまな州に所在するさまざまな会社の職員の平均年齢を計算できる数値コリレーション分析を作成します。分析には、STATE、AGE、COMPANYという3つのデータベースカラムが使用されています。
情報メモ制約事項: 数値コリレーション分析は、データベースカラムでのみ可能です。この分析は、ファイル接続では使用できません。

数値コリレーション分析を定義

手順

  1. [DQ repository] (DQリポジトリー)ツリービューで[Data Profiling] (データプロファイリング)を展開し、[Analyses] (分析) > [New analysis] (新しい分析)を右クリックします。
    Analysesノードのコンテキストメニュー。
    [Create new analysis] (新しい分析を作成)ウィザードが開きます。
  2. [Correlation] (コリレーション) > [Numerical Correlation Analysis] (数値コリレーション分析)と選択し、[Create] (作成)をクリックします。
  3. [Name] (名前)フィールドに、現在の分析の名前を入力します。
    情報メモ重要:

    ~ ! ` # ^ * & \\ / ? : ; \ , . ( ) ¥ ' " " " < > といった特殊文字は項目名に使用しないでください。

    ファイルシステムでは、これらの文字はすべて"_"に置き換えられ、重複する項目が作成されてしまう場合があります。

  4. 該当するフィールドで、分析メタデータ(目的説明作成者)を設定して[Finish] (終了)をクリックします。

タスクの結果

新しく作成された分析用のノードは[DQ repository] (DQリポジトリー)ツリービュー内の[Analysis] (分析)の下に表示され、分析メタデータで分析エディターが表示されます。

分析するカラムの選択と分析パラメーターの設定

手順

  1. [Connection] (接続)メニューから、分析を実行するデータベース接続を選択します。
    現在のところ、数値コリレーション分析はデータベースカラムでのみ可能です。[Connection] (接続)リストから他の接続を選択すると、データベース接続を変更できます。新しく設定するデータベース接続に分析済みカラムが存在しない場合は警告メッセージが表示され、操作を続行またはキャンセルできます。
  2. 必要であればSQL WHERE句を入力し、分析を実行するデータをフィルタリングします。
  3. [Columns] (カラム)メニューで、[Select columns] (カラムを選択)をクリックします。
  4. 分析するカラムへのデータベース接続で、カタログまたはスキーマを参照します。
    [Table filter] (テーブルフィルター)フィールドや[Column filter] (カラムフィルター)フィールドに必要なテキストを入力すると、テーブルやカラムのリストをフィルタリングできます。リストには、入力したテキストに対応するテーブルまたはカラムのみ表示されます。
  5. テーブル名をクリックし、含まれているカラムをすべて[Column Selection] (カラム選択)ダイアログボックスの右にあるパネルにリスト表示します。
  6. カラムリストで、分析するカラムのチェックボックスをオンにしてOKをクリックします。
    この例では、さまざまな州に所在するさまざまな会社の職員の平均年齢を計算します。分析するカラムは、AGE、COMPANY、STATEです。
    分析するカラムは、[DQ repository] (DQリポジトリー)ツリービューの該当するデータベース接続から[Analyzed Columns] (分析済みカラム)エリアに直接ドラッグできます。
    [Analyzed Columns] (分析済みカラム)ビューにリスト表示されているいずれかのカラムを右クリックして[Show in DQ repository view] (DQリポジトリービューで表示)を選択すると、選択されたカラムがツリービューの対応する接続の下へ自動的に配置されます。
    選択されたカラムが分析エディターの[Analyzed Columns] (分析済みカラム)セクションに表示されます。
  7. [Indicators] (インジケーター)メニューで、必要であれば[Settings] (設定)をクリックし、一部のインジケーターにしきい値を設定します。
    [インジケーター]ダイアログボックスの概要。
    シンプル統計を表すインジケーターは、デフォルトでこの分析タイプに関連付けられています。
  8. [Advanced settings] (分析設定)メニューで、 [Number of connections per analysis] (分析ごとの接続数)を設定します。
    この数値はデータベースの利用可能リソース、つまりデータベースがサポートできる同時接続数に基づいて設定します。
  9. コンテキスト変数を使用したい場合は、[Open context view] (コンテキストビューを開く)をクリックします。
    コンテキスト変数を設定すれば、データをフィルタリングし、分析ごとの同時接続数を決定できます。
    コンテキストと変数の詳細は、分析でコンテキスト変数を使用をご覧ください。
  10. [Save and run] (保存して実行)をクリックします。

タスクの結果

エディターが分析結果に切り替わります。
「AGE対カウントの平均」のグラフィカルな結果。

分析結果の詳細は、数値コリレーション分析結果の検討をご覧ください。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。