メイン コンテンツをスキップする 補完的コンテンツへスキップ

データパターンで自動学習を有効化

データ分類操作では、データパターンを使い、一致する基準に基づいてデータクラスをインポートオブジェクトに一致させます。

学習データクラスを承認またはリジェクトすると、Talend Data Catalogはその情報を吸収し、データパターンに対する理解を向上させます。

始める前に

  • [Application Administration] (アプリケーション管理)機能を持つグローバルロールに割り当てられていること。
  • データクラスのプロパティで[Auto Learning] (自動学習)オプションが有効になっていること。
  • 選択したオブジェクトのデータが既にサンプリングおよびプロファイリング済みであること。

手順

  1. 学習のベースとして使いたいオブジェクトページを開きます。
  2. データクラスをそのオブジェクトに手動で割り当てます。
  3. [MANAGE] (管理) > [Data Classes] (データクラス)に移動し、学習用データクラスのプロパティを開きます。
    [Data Pattern (データパターン)エリアの値の横に青色の数字が表示されている場合は、学習済みであることを意味します。
    値の横にある青い数字はその特定値に一致したデータのインスタンスの割合で、最小値は10%です。

    Talend Data Catalogは、[Matching threshold] (マッチングしきい値)フィールドで指定されている割合に適合する値やパターンをすべてピックアップします。

    その横にある青色の値がさらに大きいデータパターンはより正確であると思われます。考えられる値やパターンのリストを調整できます。
  4. [Auto Learning] (自動学習)チェックボックスをオフにすると、このオプションが無効になります。
  5. データパターンのリストは、精度が低いパターンを削除して調整します。
  6. 変更を保存します。

タスクの結果

好ましいパターンのセットが準備できたら、他のオブジェクトでデータ分類を呼び出し、そのオブジェクトにデータクラスを自動的に関連付けることができます。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。