Générer un modèle de rapprochement
Ce scénario s'applique uniquement aux produits Talend Platform avec Big Data nécessitant souscription et à Talend Data Fabric.
Le composant tMatchModel lit l'échantillon de paires suspectes généré par le tMatchPairing et manuellement libellé par vos soins.
Le tMatchModel génère plusieurs modèles de rapprochement, cherche automatiquement la meilleure combinaison des paramètres d'apprentissage et conserve le meilleur modèle de rapprochement sortant des résultats de la validation croisée.
Le scénario décrit ici utilise les composants suivants :
-
un composant tFileInputDelimited lisant le fichier source contenant les paires de données suspectes générées par le tMatchPairing,
-
un composant tMatchModel générant les caractéristiques depuis les enregistrements suspects, implémentant l'algorithme Random Forest et créant un modèle de classification.