tFuzzyJoin 標準プロパティ
これらのプロパティは、標準ジョブのフレームワークで実行されているtFuzzyJoinを設定するために使われます。
標準のtFuzzyJoinコンポーネントは、データクオリティファミリーに属しています。
このコンポーネントは、Talend Data Management PlatformTalend Big Data Platform、Talend Real-Time Big Data PlatformTalend Data Services Platform、Talend MDM PlatformおよびTalend Data Fabricで使用できます。
基本設定
[Schema] (スキーマ)と[Edit schema] (スキーマを編集) |
スキーマとは行の説明で、処理された後に次のコンポーネントに渡されるフィールドの数を定義するものです。スキーマは[Built-in] (組み込み)か、[Repository] (リポジトリー)にリモートで保存されます。 |
|
[Built-in] (組み込み): そのコンポーネントに対してのみスキーマを作成し、ローカルに保管します。[Basic settings] (基本設定)タブにあるコンポーネントスキーマの詳細は、[Basic settings] (基本設定)をご覧ください。 |
|
[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保存されています。他のプロジェクトやジョブデザインで再利用できます。[Basic settings] (基本設定)タブにあるコンポーネントスキーマの詳細は、[Basic settings] (基本設定)をご覧ください。 |
[Include lookup columns in output] (ルックアップカラムを出力に含める) |
定義するルックアップカラムを出力フローに含めるには、このチェックボックスをオンにします。 |
[Input key attribute] (入力キー属性) |
参照(ルックアップ)キーカラムを基にチェックする必要のあるメインフローからカラムを選択します。 |
[Lookup key attribute] (ルックアップキー属性) |
入力フローからのカラムを比較する参照元として使用するルックアップキーカラムを選択します。 |
[Matching type ] (マッチングタイプ) |
関連するマッチングアルゴリズムをリストから選択します。 [Exact Match] (完全マッチング): 処理された各エントリーを、まったく同じ値を持つすべての可能な参照エントリーにマッチングさせます。 Levenshtein: 編集距離理論に基づきます。参照エントリーとマッチングするエントリーに必要な挿入、削除、置換の回数を計算します。 [Metaphone] (メタフォン):発音によるエントリーの索引付けのための音声アルゴリズムに基づいています。ルックアップ参照のすべてのエントリーの発音をロードし、メインフローのすべてのエントリーを参照フローのエントリーに対してチェックします。 [Double Metaphone] (二重メタフォン): 音声アルゴリズムの新しいバージョン。元のアルゴリズムよりも正確な結果をもたらすメタフォン。文字列のプライマリーコードとセカンダリーコードの両方を返すことができます。これはあいまいなケースや共通の系統を持つ姓の複数のバリエーションに対応しています。 |
Case sensitive |
このチェックボックスを選択して、大文字と小文字を考慮します。 |
[Min distance] (最小距離) |
Levenshteinのみ参照とマッチングするために許可される変更の最小数を設定するために使われます。0に設定すると、[Exact Match] (完全マッチング)のみが返されます。 情報メモ注:
最小距離と最大距離のコンテクスト変数を作成および保管し、低い最大数から行とマッチングさせ、より高い最大数に増やして可能な行とさらにマッチングさせることができます。[Ctrl+Space]を押して、変数リストにアクセスして、新しいコンテキスト変数を選択できます。コンテキスト変数の詳細は、コンテキストと変数を使用をご覧ください。 |
[Max distance] (最大距離) |
Levenshteinのみ参照とマッチングするために許可される変更の最大数を設定するために使われます。 |
[Inner join (with reject output)] (内部結合(リジェクト出力付き)) |
最初に2つのテーブルを結合し、リジェクトデータをメインフローから収集するには、このチェックボックスをオンにします。 |
詳細設定
[tStat Catcher Statistics] (tStatCatcher統計) |
このチェックボックスを選択すると、コンポーネントレベルでログデータを収集できます。 |
グローバル変数
グローバル変数 |
ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。 Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。 フィールドまたは式に変数を入力する場合は、Ctrl + スペースを押して変数リストにアクセスし、使用する変数を選択します。 変数の詳細は、コンテキストと変数を使用をご覧ください。 |
使用方法
使用ルール |
このコンポーネントは、非推奨です。代わりにtRecordMatchingコンポーネントを使います。 このコンポーネントは、開始可能でなく、2つの入力コンポーネントと1つ以上の出力コンポーネントを必要とします。 |