分析するカラムのセットを定義
- Big Data Platform
- Cloud API Services Platform
- Cloud Big Data Platform
- Cloud Data Fabric
- Cloud Data Management Platform
- Data Fabric
- Data Management Platform
- Data Services Platform
- MDM Platform
- Qlik Talend Cloud Enterprise Edition
- Qlik Talend Cloud Premium Edition
- Real-Time Big Data Platform
始める前に
手順
- [DQ Repository] (DQリポジトリー)ツリービューで[Data Profiling] (データプロファイリング)を展開し、[Analyses] (分析)をクリックします。
- [New Analysis] (新しい分析)をクリックします。[Create New Analysis] (新しい分析を作成)ウィザードが開きます。
- Column Set Analysisの最初の数文字を入力して、[Column Set Analysis] (カラムセット分析)を選択して[Next] (次へ)をクリックします。
- 名前を入力します。
- オプション: 該当するフィールドで、カラム分析のメタデータ(目的、説明、作成者)を設定します。
- [Next] (次へ)をクリックし、データベースの接続先を選択します。
- [DB connections] (データベース接続)を展開します。
-
目的のデータベースで分析するカラムを参照して選択し、[Finish] (終了)をクリックしてウィザードを閉じます。
この例では、customerテーブルでアカウント番号(account_num)、教育(education)、メール(email)、ファーストネーム(fname)、セカンドネーム(Iname)、性別(gender)という6つのカラムを分析します。分析結果に表示される統計は、行数、個別数、一意数、超複数で、いずれもレコード(カラムセットの値)に適用されます。定義された分析メタデータと共に分析エディターが開き、新規作成された分析用のフォルダーが[DQ Repository] (DQリポジトリー)ツリービュー内の[Analyses] (分析)の下に表示されます。
このサンプルでは、customerテーブル内のカラム6つのセット、つまり口座番号 (account_num)、教育(education)、メールアドレス(email)、ファーストネーム(fname)、セカンドネーム(Iname)、性別(gender)を分析します。分析結果に表示される統計は、行数、個別数、一意数、超複数で、いずれもレコード(カラムセットの値)に適用されます。
-
[Data preview] (データプレビュー)セクションで、オプションを1つ選択します:
オプション 結果 [New Connection] (新規接続) ウィザードを開き、エディター内からデータソースへの接続を作成するか、変更します。 このセクションの上部にある[Connection] (接続)フィールドには、Talend Studioで作成した接続がすべてリスト表示されています。
[Select Columns] (カラムを選択) [Column Selection] (カラム選択)ダイアログボックスを開くと、テーブル内にリスト表示されているカラムを選択し、その選択を分析または変更できます。 開いたダイアログボックスで[Table filter] (テーブルフィルター)フィールドや[Column filter] (カラムフィルター)フィールドに必要なテキストを入力すると、テーブルやカラムのリストをフィルタリングできます。
[n first rows] (最初のn行)または[n random rows] (ランダムなn行) 選択したカラムから最初のNデータレコードをテーブルにリスト、または選択したカラムからランダムなNレコードをリスト表示します。 [Refresh Data] (データを更新) 設定した条件に従って、選択したカラムにデータを表示させます。 [Run with sample data] (サンプルデータで実行) [Limit] (制限)フィールドで、サンプルデータセットにのみ分析を実行します。 - [Limit] (制限)フィールドで、テーブルに表示してサンプルデータとして使用するデータレコードの数を設定します。