出力フローに機能キーを生成する
このシナリオはTalend Data Management Platform、Talend Big Data PlatformTalend Real-Time Big Data Platform、Talend MDM PlatformTalend Data Services Platform、Talend MDM PlatformおよびTalend Data Fabricにのみ適用されます。
この3つのコンポーネントのシナリオでは、PostalCodeの入力カラムの1つに1つのアルゴリズムを使用して、各データレコードの機能キーを生成する基本的なジョブについて説明します。
この機能キーは、たとえば、データフィルタリングまたはデータ一致の結果を絞り込むためにさまざまな方法で使用できます。そのため、tGenKeyコンポーネントは、他の多くのデータクオリティやデータ統合コンポーネントと共に使用して、さまざまな有用なユースケースを形成できます。tGenKeyの使用例は、同じ機能キーを持つ出力フロー重複レコード内でカラムを比較し、グルーピングするをご覧ください。
このシナリオでは、入力データフローには、[Firstname] (名前)、[Lastname] (姓)、[DOB] (生年月日)、および[PostalCode] (郵便番号)の4つのカラムがあります。このデータには、重複、異なったスペルまたは間違ったスペルの姓や名、同じ顧客の異なった情報などの問題があります。このシナリオでは、郵便番号の最初の2文字を連結するアルゴリズムを使用して、各データレコードの機能キーを生成します。