メイン コンテンツをスキップする 補完的コンテンツへスキップ

システムインジケーターを設定

このカラム分析では、標準のインジケーターを使用して、メールと電話番号カラムの行、空白、重複値などのシンプル統計を示します。

始める前に

  • Talend StudioProfilingパースペクティブを開いていること。

  • カラム分析が作成済みで、データベースへの接続が定義済みであること。

手順

  1. 分析エディターの[Data Preview] (データプレビュー)セクションで[Select Indicators] (インジケーターを選択)をクリックし、[Indicator Selection] (インジケーターの選択)ダイアログボックスを開きます。
  2. [Simple Statistics] (シンプル統計)を展開し、[Row Count] (行数)[Blank Count] (空白数)[Duplicate Count] (重複値)を選択します。[OK]をクリックしてウィザードを閉じます。

    データの一貫性を調べるために、EmailカラムとPhoneカラムの行数、空白値、重複値を確認します。

    それによって、[Analyzed Columns] (分析済みカラム)セクション内のカラムにインジケーターが付加されます。

  3. [Duplicate Count] (重複値)インジケーターと[Blank Count] (空白数)インジケーターの横にある[Options] (オプション)をクリックし、[Upper threshold] (上限しきい値)フィールドを0に設定します。

    EmailカラムとPhoneカラムのしきい値を定義すると、分析結果の重複値と空白値のカウントが赤で書き込まれるため、大変便利です。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。