Générer un modèle de rapprochement
Ce scénario s'applique uniquement aux produits Talend Platform avec Big Data et à Talend Data Fabric.
Le composant tMatchModel lit l'échantillon de paires suspectes généré par le tMatchPairing et manuellement libellé par vos soins.
Pour plus d'informations, consultez la documentation relative au tMatchPairing sur Talend Help Center (https://help.talend.com (uniquement en anglais)).
Le tMatchModel génère plusieurs modèles de rapprochement, cherche automatiquement la meilleure combinaison des paramètres d'apprentissage et conserve le meilleur modèle de rapprochement sortant des résultats de la validation croisée.
Le scénario décrit ici utilise les composants suivants :
-
un composant tFileInputDelimited lisant le fichier source contenant les paires de données suspectes générées par le tMatchPairing,
-
un composant tMatchModel générant les caractéristiques depuis les enregistrements suspects, implémentant l'algorithme Random Forest et créant un modèle de classification.