Création et configuration de l'expérimentation
La première étape consiste à créer et à configurer l'expérimentation. Vous allez utiliser l'ensemble de données d'apprentissage précédemment chargé pour former le modèle jusqu'à ce qu'il soit prêt à être déployé pour faire des prédictions.
Création d'une nouvelle expérimentation
Procédez comme suit :
-
Dans le hub Analyses Qlik Cloud, cliquez sur Ajouter nouveau, puis sélectionnez Nouvelle expérimentation ML.
-
Saisissez un nom pour votre expérimentation, par exemple, Didacticiel Perte de clientèle.
-
Vous pouvez éventuellement ajouter une description et des balises.
-
Sélectionnez un espace pour votre expérimentation. Il peut s'agir de votre espace personnel ou d'un espace partagé.
-
Cliquez sur Créer.
-
Sélectionnez le fichier Customer churn data - training.csv.
Examen des données
Vous êtes maintenant prêt à commencer à configurer l'expérimentation, mais, avant de commencer, examinons l'ensemble de données.
Commençons dans la vue Schéma. Ici, nous voyons un tableau dont chaque ligne représente une colonne de votre ensemble de données Des statistiques et des informations ont été générées lors de la préparation automatique des données. Pour afficher les informations, vous devrez peut-être accéder au côté droit du schéma.
Nous voyons que la caractéristique AccountID (ID de compte) a été exclue, en raison de sa forte cardinalité. Cela signifie que la colonne contient un trop grand nombre de valeurs uniques. La caractéristique Country (Pays) a été exclue pour la raison inverse : la valeur est la même pour toutes les lignes. Ces deux caractéristiques n'apporteraient aucune valeur aux modèles d'apprentissage machine.
Nous voyons également que la caractéristique catégorique Territory (Territoire) a fait l'objet d'un impact encoding. Pour plus d'informations, survolez les icônes d'avertissement et d'informations
à l'aide de la souris.
Vue Schéma de l'ensemble de données d'apprentissage dans Qlik AutoML

Cliquez sur l'icône de la vue Données pour passer à la vue Données. Ici, nous voyons davantage d'informations sur chaque colonne, y compris des échantillons de données.
Vue Données

Sélection d'une cible
Nous voulons que notre modèle d'apprentissage machine prédise la perte de clientèle. Nous sélectionnons donc Churned (Perte), la dernière colonne de l'ensemble de données, comme cible.
Procédez comme suit :
-
Survolez Churned à l'aide de la souris et cliquez sur l'icône de cible
qui apparaît.
Une ligne de la vue Schéma est sélectionnée comme cible

Dans le volet Configuration de l'expérimentation, nous voyons que Churned a été sélectionné. Nous voyons également que 16 des 19 caractéristiques possibles sont automatiquement sélectionnées (toutes sauf AccountID et Country, ainsi que Churned, qui est la cible) et que cette expérimentation sera traitée comme un problème de classification binaire.
Informations affichées dans le volet Configuration de l'expérimentation

Sélection de caractéristiques
Pour cette première exécution de l'expérimentation, nous allons inclure l'ensemble des caractéristiques et algorithmes disponibles. Cependant, si vous savez déjà, en fonction de vos connaissances métier, que certaines caractéristiques n'ont aucune influence sur la cible, vous pouvez les désélectionner à ce stade pour les exclure de l'apprentissage.
Apprentissage de l'expérimentation
La configuration est terminée et nous sommes prêts à démarrer l'apprentissage.
Procédez comme suit :
-
Dans le coin inférieur droit de la fenêtre de l'expérimentation, cliquez sur Exécuter l'expérimentation.
Une fois l'exécution de l'expérimentation terminée, nous pouvons passer à l'étape suivante, qui consiste à examiner les métriques obtenues du modèle.