Création et configuration de l'expérimentation
La première étape consiste à créer et à configurer l'expérimentation. Vous allez utiliser le jeu de données d'apprentissage précédemment chargé pour former le modèle jusqu'à ce qu'il soit prêt à être déployé pour faire des prédictions.
Création d'une nouvelle expérimentation
Procédez comme suit :
-
Accédez à la page Créer du centre d'activités Analyses et sélectionnez Expérimentation ML.
-
Saisissez un nom pour votre expérimentation, par exemple, Didacticiel Perte de clientèle.
-
Vous pouvez éventuellement ajouter une description et des balises.
-
Sélectionnez un espace pour votre expérimentation. Il peut s'agir de votre espace personnel ou d'un espace partagé.
-
Cliquez sur Créer.
-
Sélectionnez le fichier du jeu de données d'apprentissage. Il s'agira de l'un des suivants, selon que vous utilisez le format CSV ou QVD :
-
AutoML Tutorial - Churn data - train.csv
-
AutoML Tutorial - Churn data - train.qvd
-
Examen des données
Vous êtes maintenant prêt à commencer à configurer l'expérimentation, mais, avant de commencer, examinons le jeu de données.
Nous commençons dans l'onglet Données. La vue par défaut est la Vue Schéma. Ici, nous voyons un tableau dont chaque ligne représente une colonne de votre jeu de données Des statistiques et des informations ont été générées lors de la préparation automatique des données. Pour afficher les informations, vous devrez peut-être accéder au côté droit du schéma.
Nous voyons que la caractéristique AccountID (ID de compte) a été exclue, en raison de sa forte cardinalité. Cela signifie que la colonne contient un trop grand nombre de valeurs uniques. La caractéristique Country (Pays) a été exclue pour la raison inverse : la valeur est la même pour toutes les lignes. Ces deux caractéristiques n'apporteraient aucune valeur aux modèles d'apprentissage automatique.
Nous voyons également que la caractéristique catégorique Territory (Territoire) a fait l'objet d'un impact encoding. Pour plus d'informations, survolez les icônes d'avertissement et d'informations à l'aide de la souris.
Cliquez sur la Vue Données. Dans cette vue, nous pouvons voir davantage d'informations sur chaque colonne, y compris des échantillons de données.
Sélection d'une cible
Nous voulons que notre modèle d'apprentissage automatique prédise la perte de clientèle. Nous sélectionnons donc Churned (Perte), la dernière colonne du jeu de données, comme cible.
Procédez comme suit :
-
Revenez à la Vue Schéma.
-
Survolez Churned à l'aide de la souris et cliquez sur l'icône de cible qui apparaît.
Dans le panneau Configuration de l'expérimentation, nous voyons maintenant que Churned a été sélectionné. Nous voyons également les caractéristiques automatiquement sélectionnées et celles automatiquement exclues. Étant donné que la cible est Churned, cette valeur ne peut pas être utilisée comme caractéristique. Nous voyons également que cette expérimentation sera traitée comme un problème de classification binaire.
Sélection de caractéristiques
Pour cette première exécution de l'expérimentation, nous allons inclure l'ensemble des caractéristiques et algorithmes sélectionnés par défaut. Cependant, si vous savez déjà, en fonction de vos connaissances métier, que certaines caractéristiques n'ont aucune influence sur la cible, vous pouvez les désélectionner à ce stade pour les exclure de l'apprentissage.
Modification des paramètres d'optimisation
L'optimisation de modèle intelligente est activée par défaut. Grâce à l'optimisation de modèle intelligente, AutoML fournit un affinement automatique de l'apprentissage de modèle.Cependant, l'objectif de ce didacticiel est de vous montrer comment identifier manuellement certains problèmes dans vos données de caractéristiques et vos résultats d'apprentissage.
Pour un exemple de la manière d'effectuer l'apprentissage de modèles avec l'optimisation de modèle intelligente, consultez Exemple – Apprentissage de modèles avec l'apprentissage automatique automatisé.
Désactivons l'optimisation de modèle intelligente pour montrer un affinement manuel.
Procédez comme suit :
-
Dans le panneau Configuration de l'expérimentation, développez la section Optimisation du modèle.
-
Passez de Intelligente à Manuelle.
Apprentissage de l'expérimentation
La configuration est terminée et nous sommes prêts à démarrer l'apprentissage.
Procédez comme suit :
-
Dans le coin inférieur droit de la fenêtre de l'expérimentation, cliquez sur Exécuter l'expérimentation.
Une fois l'exécution de l'expérimentation terminée, nous pouvons passer à l'étape suivante, qui consiste à examiner les métriques obtenues du modèle.