パターンを使って区切り付きファイルでカラムセット分析を作成
この分析タイプでは、特定のカテゴリーに該当するレコードの数(行数、NULL値の数、重複を除いた一意値の数、重複値の数、空白フィールドの数など)でシンプル統計が行われます。
シンプル統計インジケーターの詳細は、シンプル統計をご覧ください。
また、この分析タイプにパターンを追加し、「すべて」のパターンにマッチする行数を単一の結果棒グラフに表示させることもできます。
区切り付きファイル内で分析するカラムのセットを定義
区切り付きファイル内にあるカラムのセットのコンテンツを分析できます。このセットは、定義されたテーブルやテーブル全体の一部のカラムしか表現していない場合があります。
その場合はJavaエンジンを使って、作成された分析を実行できます。
Before you begin
情報メモWarning: この分析タイプを実行する時は、分析するカラムのセットにプライマリキーのカラムを含めないようにしてください。
Procedure
区切り付きファイル内の分析済みカラムにパターンを追加
カラム分析のように特定のパターンに対して各カラムを検証するのではなく、分析済みカラムにパターンを追加して全パターンに対して完全レコード(すべてのカラム)を検証できます。結果グラフは、使用されたパターンの総計を表す単一棒グラフとなります。このグラフには、「すべて」のパターンにマッチする行数が表示されます。
情報メモWarning: カラムセット分析で特定のパターンを使用できるようになる前に、Java用のパターン定義が存在しない場合はパターン設定で手動で設定する必要があります。設定しない場合は警告メッセージが表示され、Java正規表現の定義を設定するよう求められます。
Before you begin
Procedure
選択したカラムに追加する式のチェックボックスをオンにし、OKをクリックします。
追加された正規表現は[Analyzed Columns] (分析済みカラム)ビューの分析カラムの下に表示され、[All Match] (すべて一致)インジケーターは[Indicators] (インジケーター)ビューの[Indicators] (インジケーター)リストに表示されます。
![追加された正規表現は[分析済みカラム]セクションにあるカラムの下に表示されます。](/talend/ja-JP/studio-user-guide/8.0-R2025-01/Content/Resources/images/FlatFile_ColumnSet5.png)
区切り付きファイルでカラムセット分析をを確定および実行
このカラムセット分析を実行する前に、インジケーターの設定、データフィルター、分析パラメーターを定義する作業が残っています。
Before you begin
Procedure
Results
![[シンプル統計]セクションにある[シンプル統計]インジケーターに対応するグラフィカルな結果。](/talend/ja-JP/studio-user-guide/8.0-R2025-01/Content/Resources/images/ColumnSet_Analysis6.png)
分析するカラムのセットのコンテンツに一致させるためにパターンを使う場合は、使用するパターンの総計に対して一致結果と非一致結果を表すグラフが表示されます。
![[すべて一致]セクションのパターンに対する一致値と不一致値のグラフィカルな結果。](/talend/ja-JP/studio-user-guide/8.0-R2025-01/Content/Resources/images/ColumnSet_Analysis10.png)