Générer un modèle de rapprochement à partir d'une campagne Grouping
Ce scénario s'applique uniquement aux produits Talend Platform avec Big Data nécessitant souscription et à Talend Data Fabric.
Le tMatchModel lit l'échantillon de paires suspectes calculé à partir d'une liste de centres d'éducation de la petite enfance en doublon et libellé par des data stewards dans Talend Data Stewardship. Il génère plusieurs modèles de rapprochement, recherche la meilleure combinaison pour les paramètres d'apprentissage et conserve le meilleur modèle de rapprochement sortant des résultats de la validation croisée.
- Vous devez avoir généré les paires de données suspectes en utilisant le tMatchPairing et les avoir libellées dans Talend Data Stewardship. Pour plus d’informations, consultez Calculer des paires suspectes et écrire un échantillon dans Talend Data Stewardship.
Pour plus d'informations concernant la gestion des tâches de regroupement pour décider des relations entre les paires d'enregistrements, consultez Exemples d'utilisation de Talend Data Stewardship.