メイン コンテンツをスキップする 補完的コンテンツへスキップ

分析するカラムを定義

カラムのコンテンツを分析する最初のステップは、分析するカラムを定義することです。分析結果から、各カラムの値に関する統計が得られます。

始める前に

Talend StudioProfilingパースペクティブでデータベース接続が少なくとも1つ定義されていること。

このタスクについて

Dateカラムを分析し、Javaエンジンを使用して分析を実行することを選んだ場合、日付情報はTalend Studio およびデータマートに通常の日付/時刻として保存されます。日付/タイムスタンプの形式はYYYY-MM-DD HH:mm:ss.SSSで、時間の形式はHH:mm:ss.SSSです。SQLエンジンで分析を実行する場合、日付と時刻の形式は僅かに異なります。

基本的なカラム分析を定義

手順

  1. [DQ repository] (DQリポジトリー)ツリービューで[Data Profiling] (データプロファイリング)を展開し、[Analyses] (分析) > [New analysis] (新しい分析)を右クリックします。
    Analysesノードのコンテキストメニュー。
    [Create new analysis] (新しい分析を作成)ウィザードが開きます。
  2. [Column] (カラム) > [Basic column analysis] (基本カラム分析)と選択し、[Create] (作成)をクリックします。
  3. [Name] (名前)フィールドに、現在のカラム分析の名前を入力します。
    情報メモ重要:

    ~ ! ` # ^ * & \\ / ? : ; \ , . ( ) ¥ ' " " " < > といった特殊文字は項目名に使用しないでください。

    ファイルシステムでは、これらの文字はすべて"_"に置き換えられ、重複する項目が作成されてしまう場合があります。

  4. オプション: 該当するフィールドで、カラム分析のメタデータ(目的説明作成者)を設定して[Next] (次へ)をクリックします。

データベースカラムを選択してサンプルデータを設定

手順

  1. [Connection] (接続)メニューで接続を選択し、[Next] (次へ)をクリックします。
    情報メモ注: DB2データベースでプロファイリングをする場合、テーブルのカラム名に二重引用符が使用されていても、カラムを取得する際に二重引用符は取得されません。そのため、DB2データベースのテーブルではカラム名に二重引用符を使用しないことが推奨されます。
  2. [Run with sample data] (サンプルデータで実行)チェックボックスを選択し、 [Limit] (制限)フィールドで、サンプルデータセットにのみ分析を実行します。
  3. [Columns] (カラム)メニューで、[Select columns] (カラムを選択)をクリックします。 データプレビューが表示されます。
    このメニューから、次の操作を実行できます:
    • [Select Columns] (カラムを選択): [Column Selection] (カラム選択)ダイアログボックスを開くと、テーブル内にリスト表示されているカラムを選択し、その選択を分析または変更できます。開いたダイアログボックスで[Table filter] (テーブルフィルター)フィールドや[Column filter] (カラムフィルター)フィールドに必要なテキストを入力すると、テーブルやカラムのリストをフィルタリングできます。
    • [Refresh Data] (データを更新): 設定した条件に従って、選択したカラムにデータを表示します。
    • [新しい接続]: ウィザードを開き、エディター内からデータソースへの接続を作成します。

      このセクションの上部にある[Connection] (接続)フィールドには、Talend Studioで作成した接続がすべてリスト表示されています。

    • [n first rows] (最初のn行)または [n random rows] (ランダムなn行): 選択したカラムから最初のNデータレコードをテーブルにリスト、または選択したカラムからランダムなNレコードをリスト表示します。
  4. [Next] (次へ)をクリックし、カラムにインジケーターを設定します。
  5. [Indicators] (インジケーター)メニューで[Select Indicators] (インジケーターを選択)をクリックし、カラムのプロファイリングに使用するインジケーターを選択します。
    分析するカラムの1つがプライマリキーまたは外部キーの場合、そのデータマイニングタイプは、[Analyzed Columns] (分析済みカラム)リストで表示すると、自動的に[Nominal] (名義)になります。
    データマイニングタイプの詳細は、データマイニングタイプを参照してください。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。