データプロファイリングの詳細
Talend Data Catalogでは、テーブル/ビューやカラムオブジェクトについて、次のデータプロファイル情報を保存および表示できます:
| タイプ | 説明 |
|---|---|
| 推測済みデータ型 [型, 行] | データ型の一致数とその頻度(%)のリストで、最高値から最小値の順に分類されています。 カラムのデータ型はプロファイラーによって検出されます。カラムにさまざまなデータ型のデータが存在する場合、プロファイラーは最も使用されているデータ型を選びます。値は手動で上書きできます。この値はデータベースで宣言されているデータ型と矛盾することもあります。たとえばVARCHARデータベースのカラムに日付値しか含まれていなければ、プロファイラーはDateデータ型を設定します。 サポートされている型は、Text、Date、Time、DateTime、Geographical、No Percentiles、Means、Median、Variance、Std. Deviation、Numberです。 |
| 日付 [値, 行] | 値とその頻度(%)のディストリビューション。 |
| パターン [パターン, 行] | ソースとその頻度(%)で検出されたデータプレゼンテーションのさまざまなパターンのリスト。 |
| データプロファイリング統計 |
|