データプロファイリングの詳細
Talend Data Catalogでは、テーブル/ビューやカラムオブジェクトについて、次のデータプロファイル情報を保存および表示できます:
タイプ | 説明 |
---|---|
推測済みデータ型 [型, 行] | データ型の一致数とその頻度(%)のリストで、最高値から最小値の順に分類されています。 カラムのデータ型はプロファイラーによって検出されます。カラムにさまざまなデータ型のデータが存在する場合、プロファイラーは最も使用されているデータ型を選びます。値は手動で上書きできます。この値はデータベースで宣言されているデータ型と矛盾することもあります。たとえばVARCHARデータベースのカラムに日付値しか含まれていなければ、プロファイラーはDateデータ型を設定します。 サポートされている型は、Text、Date、Time、DateTime、Geographical、No Percentiles、Means、Median、Variance、Std. Deviation、Numberです。 |
日付 [値, 行] | 値とその頻度(%)のディストリビューション。 |
パターン [パターン, 行] | ソースとその頻度(%)で検出されたデータプレゼンテーションのさまざまなパターンのリスト。 |
データプロファイリング統計 |
|