tFuzzyMatchの標準プロパティ
これらのプロパティは、標準ジョブのフレームワークで実行されているtFuzzyMatchを設定するために使われます。
標準のtFuzzyMatchコンポーネントは、データクオリティファミリーに属しています。
このフレームワーク内のコンポーネントは、すべてのTalend製品で使用できます。
基本設定
[Schema] (スキーマ)と[Edit schema] (スキーマを編集) |
スキーマとは行の説明で、処理された後に次のコンポーネントに渡されるフィールドの数を定義するものです。スキーマは[Built-in] (組み込み)か、[Repository] (リポジトリー)にリモートで保存されます。 2つの読み取り専用列である[Value] (値)と[Match] (マッチング)が自動的に出力スキーマに追加されます。 |
|
[Built-in] (組み込み): このコンポーネントに対してのみ作成されたスキーマがローカルに保管されます。[Basic settings] (基本設定)タブにあるコンポーネントスキーマの詳細は、[Basic settings] (基本設定)をご覧ください。 |
|
[Repository] (リポジトリー): 既存のスキーマがリポジトリーに保管されているので、さまざまなプロジェクトやジョブデザインで再利用できます。[Basic settings] (基本設定)タブにあるコンポーネントスキーマの詳細は、[Basic settings] (基本設定)をご覧ください。 |
[Matching type ] (マッチングタイプ) |
次の中から適切なマッチングアルゴリズムを選択します。 Levenshtein: 編集距離理論に基づきます。参照エントリーとマッチングするエントリーに必要な挿入、削除、置換の回数を計算します。 [Metaphone] (メタフォン):発音によるエントリーの索引付けのための音声アルゴリズムに基づいています。ルックアップ参照のすべてのエントリーの発音をロードし、メインフローのすべてのエントリーを参照フローのエントリーに対してチェックします。 漢字はサポートしていません。 [Double Metaphone] (二重メタフォン): 音声アルゴリズムの新しいバージョン。元のアルゴリズムよりも正確な結果をもたらすメタフォン。文字列のプライマリーコードとセカンダリーコードの両方を返すことができます。これはあいまいなケースや共通の系統を持つ姓の複数のバリエーションに対応しています。 漢字はサポートしていません。 |
[Min distance] (最小距離) |
(Levenshteinのみ)参照とマッチングするために許可される変更の最小数を設定するために使われます。0に設定すると、完全マッチングのみが返されます。 |
[Max distance] (最大距離) |
(Levenshteinのみ)参照とマッチングするために許可される変更の最大数を設定するために使われます。 |
[Matching column] (マッチングカラム) |
参照(ルックアップ)キーカラムに対して照合が必要なメインフローのカラムを選択します |
[Unique matching] (一意のマッチング) |
利用できるマッチングがいくつか存在する場合は、可能な限りマッチングさせるため、このチェックボックスをオンにします。 |
[Matching item separator] (項目セパレータのマッチング) |
いくつかのマッチングが利用可能な場合、一意のマッチングボックスが選択されていなければ、それらはすべて表示されます。すべてのマッチング間の区切り文字を定義します。 |
詳細設定
[tStatCatcher Statistics] (tStatCatcher統計) |
このチェックボックスを選択すると、コンポーネントレベルでログデータを収集できます。 |
グローバル変数
グローバル変数 |
NB_LINE: 入力コンポーネントによって読み取られた行の数、または出力コンポーネントに転送された行の数。これはAfter変数で、整数を返します。 ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。 Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。 フィールドまたは式に変数を入力する場合は、Ctrl + スペースを押して変数リストにアクセスし、使用する変数を選択します。 変数の詳細は、コンテキストと変数を使用をご覧ください。 |
使用方法
使用ルール |
このコンポーネントは、起動可能(緑色の背景)ではなく、2つの入力コンポーネントと1つの出力コンポーネントが必要です。 |