tBlockedFuzzyJoin
参照データソースとの照合によりあらゆるソースデータのデータクオリティを保証します。
tBlockedFuzzyJoinは、複数のカラムにファジーマッチを実行することで、2つのテーブルを結合します。このコンポーネントは、メインフローからのカラムをルックアップフローからの参照カラムと比較し、一致するデータ、一致するデータの候補、およびリジェクトデータを出力します。
tBlockedFuzzyJoinの標準プロパティ
これらのプロパティは、標準ジョブのフレームワークで実行されているtBlockedFuzzyJoinを設定するために使われます。
標準のtBlockedFuzzyJoinコンポーネントは、データクオリティファミリーに属しています。
このコンポーネントは、Talend Data Management Platform、Talend Big Data Platform、Talend Real-Time Big Data Platform、Talend Data Services Platform、Talend Data Fabricで利用できます。
基本設定
| プロパティ | 説明 | 
|---|---|
| 
                   [Schema] (スキーマ)と[Edit Schema] (スキーマを編集)  | 
               
                  
  | 
            
| 
                   [Replace output column with lookup column if matches or possible matches] (マッチング、または可能性があるマッチングの場合は、出力カラムをルックアップカラムに置き換えます)  | 
               
                   値がマッチング、または可能性があるマッチングの場合に出力カラムをルックアップカラムに置換するには、このチェックボックスをオンにします。  | 
            
| 
                   [Input key attribute] (入力キー属性)  | 
               
                   参照(ルックアップ)キーカラムを基にチェックする必要のあるメインフローからカラムを選択します。  | 
            
| 
                   [Lookup key attribute] (ルックアップキー属性)  | 
               
                   入力フローからのカラムを比較する参照元として使用するルックアップキーカラムを選択します。  | 
            
| 
                   [Matching type ] (マッチングタイプ)  | 
               
                   関連するマッチングアルゴリズムをリストから選択します。 [Exact Match] (完全マッチング): 処理された各エントリーを、まったく同じ値を持つすべての可能な参照エントリーにマッチングさせます。 Levenshtein: 編集距離理論に基づきます。参照エントリーとマッチングするエントリーに必要な挿入、削除、置換の回数を計算します。 [Metaphone] (メタフォン):発音によるエントリーの索引付けのための音声アルゴリズムに基づいています。ルックアップ参照のすべてのエントリーの発音をロードし、メインフローのすべてのエントリーを参照フローのエントリーに対してチェックします。 [Double Metaphone] (二重メタフォン): 音声アルゴリズムの新しいバージョン。元のアルゴリズムよりも正確な結果をもたらすメタフォン。文字列のプライマリーコードとセカンダリーコードの両方を返すことができます。これはあいまいなケースや共通の系統を持つ姓の複数のバリエーションに対応しています。  | 
            
| 
                   Case sensitive  | 
               
                   このチェックボックスを選択して、大文字と小文字を考慮します。  | 
            
| 
                   [Min distance] (最小距離)  | 
               
                   Levenshteinのみ参照とマッチングするために許可される変更の最小数を設定します。0に設定すると、[Exact Match] (完全マッチング)のみが返されます。 情報メモ注: 
                      
               最小距離と最大距離のコンテクスト変数を作成および保管した後にそれらの値でジョブをループさせ、低い最大数から行とマッチングさせ、より高い最大数に増やして可能な行とさらにマッチングさせることができます。[Ctrl + スペース]を押して、変数リストにアクセスして、新しいコンテキスト変数を選択できます。コンテキスト変数の詳細は、コンテキストと変数を使用をご覧ください。  | 
            
| 
                   [Max distance] (最大距離)  | 
               
                   Levenshteinのみ参照とマッチングするために許可される変更の最大数を設定します。  | 
            
詳細設定
| プロパティ | 説明 | 
|---|---|
| 
                   [tStat Catcher Statistics] (tStatCatcher統計)  | 
               
                   このチェックボックスを選択すると、コンポーネントレベルでログデータを収集できます。  | 
            
グローバル変数
| 変数 | 説明 | 
|---|---|
| 
                   グローバル変数  | 
               
                   ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。 Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。 フィールドまたは式に変数を入力する場合は、Ctrl + スペースを押して変数リストにアクセスし、使用する変数を選択します。 変数の詳細は、コンテキストと変数を使用をご覧ください。  | 
            
使用方法
| 使用方法のガイダンス | 説明 | 
|---|---|
| 
                   使用ルール  | 
               
                   このコンポーネントは、非推奨です。代わりにtRecordMatchingコンポーネントを使います。 このコンポーネントは、開始可能でなく(緑色の背景)、2つの入力コンポーネントと1つ以上の出力コンポーネントを必要とします。  |