Exemple – Apprentissage de modèles avec l'apprentissage automatique automatisé

Dans cet exemple, vous allez effectuer l'apprentissage de modèles d'apprentissage automatique via l'optimisation de modèle intelligente. Grâce à l'optimisation de modèle intelligente, AutoML effectue le processus d'itération et d'affinement de vos modèles pour vous.

Pour plus d'informations sur l'optimisation de modèle intelligente, consultez Optimisation de modèle intelligente.

Ce que vous allez apprendre

Dans cet exemple, vous allez découvrir :

comment créer et configurer une expérimentation ML ;
comment l'optimisation intelligente peut affiner automatiquement un modèle ;
comment afficher et analyser les résultats d'apprentissage.

Autres considérations

L'optimisation de modèle intelligente facilite considérablement l'affinement des modèles si vous avez un jeu de données bien préparé. Pour garantir que vos modèles sont de grande qualité dans des cas d'utilisation du monde réel, il est essentiel que vous commenciez par suivre le cadre structuré et par préparer un jeu de données d'apprentissage présentant des caractéristiques et des données appropriées. Pour plus d'informations, consultez :

Il est possible de désactiver l'optimisation de modèle intelligente pour chaque version d'expérimentation. Lorsque vous désactivez ce paramètre, vous optimisez manuellement vos modèles. L'optimisation manuelle peut s'avérer utile si vous souhaitez apporter des ajustements spécifiques à la configuration de l'expérimentation. Vous pouvez par exemple exécuter une version avec l'optimisation de modèle intelligente, puis la désactiver pour apporter de petits ajustements manuels tout en continuant à profiter de l'affinement automatique offert par l'optimisation de modèle intelligente.

Cet exemple couvre l'apprentissage d'une expérimentation avec l'optimisation intelligente. Pour un didacticiel complet montrant comment utiliser l'optimisation manuelle, consultez Didacticiel – Génération et visualisation des données de prédiction. Ce didacticiel fournit également des conseils complets sur le déploiement de modèles, la réalisation de prédictions et la visualisation des données de prédiction avec des applications Qlik Sense interactives.

Il est conseillé de suivre cet exemple

Il est conseillé de suivre cet exemple pour savoir comment utiliser l'optimisation de modèle intelligente pour affiner vos modèles d'apprentissage automatique.

Pour suivre cet exemple, vous devez disposer des rôles suivants :

Droit Professional ou Full User
Rôle de sécurité Automl Experiment Contributor dans le client
Si vous travaillez dans un espace collaboratif, les rôles d'espace requis dans les espaces dans lesquels vous allez travailler. Consultez : Gestion des autorisations dans les espaces partagés

Si vous ne parvenez pas à afficher ou à créer des ressources ML, cela signifie probablement que vous ne disposez pas des rôles, droits ou autorisations nécessaires. Pour de plus amples informations, contactez votre administrateur de clients.

Pour plus d'informations, consultez Qui peut utiliser Qlik AutoML.

Ce que vous devez faire avant de commencer

Téléchargez ce package et décompressez-le sur votre bureau :

Exemple AutoML - Optimisation de modèle intelligente

Le package contient l'jeu de données d'apprentissage à utiliser pour effectuer l'apprentissage des modèles. Le jeu de données contient des informations sur les clients dont la date d'échéance de renouvellement est passée et qui ont décidé de ne pas poursuivre leur abonnement ou de rester abonnés au service.

Procédez comme suit :

Ouvrez le centre d'activités Analyses.
Accédez à la page Créer, sélectionnez Jeu des données, puis Charger un fichier de données.
Faites glisser le fichier AutoML Example - Churn data - training.csv jusqu'à la boîte de dialogue de chargement.
Sélectionnez un espace. Il peut s'agir de votre espace personnel ou d'un espace partagé si vous souhaitez que d'autres utilisateurs puissent accéder à ces données.
Cliquez sur Charger.

Maintenant que le jeu de données est chargé, vous pouvez commencer à créer une expérimentation.

1re partie : Créez une expérimentation

Procédez comme suit :

Accédez à la page Créer du centre d'activités Analyses et sélectionnez Expérimentation ML.
Saisissez un nom pour votre expérimentation, par exemple, Exemple d'optimisation intelligente.
Vous pouvez éventuellement ajouter une description et des balises.
Sélectionnez un espace pour votre expérimentation. Il peut s'agir de votre espace personnel ou d'un espace partagé.
Cliquez sur Créer.
Sélectionnez le fichier AutoML Example - Churn data - training.csv.

2e partie : Configurez l'expérimentation

Ensuite, vous pouvez configurer l'expérimentation.

L'optimisation de modèle intelligente nécessite moins de configuration initiale que l'optimisation manuelle. Dans ce cas, vous sélectionnez une cible et vous utilisez toutes les caractéristiques incluses par défaut.

Sélection de la cible

Nous voulons que notre modèle d'apprentissage automatique prédise la perte de clientèle. Nous sélectionnons donc Churned (Perte), la dernière colonne du jeu de données, comme cible.

Dans l'expérimentation, l'onglet Données doit être le seul onglet affiché. Vous pouvez sélectionner une cible de différentes manières, mais, ici, nous utilisons la Lignes de tableau Vue Schéma qui s'est ouverte par défaut.

Procédez comme suit :

Dans le schéma, survolez Churned et cliquez sur l'icône de cible qui apparaît.

Colonne du jeu de données avec le symbole de cible. — Sélection de la cible dans la Vue Schéma

Confirmation de la sélection des caractéristiques

Une fois la cible sélectionnée, toutes les caractéristiques disponibles et recommandées sont incluses par défaut. Dans la Lignes de tableau Vue Schéma, vérifiez que toutes les caractéristiques sont incluses, sauf deux. Les cases de chaque caractéristique incluse doivent être cochées. La caractéristique Country ne peut pas être utilisée. Il n'est pas recommandé d'utiliser la caractéristique AccountID en raison d'une forte cardinalité, nous la laissons donc décochée.

Schéma montrant l'ensemble des caractéristiques disponibles et recommandées incluses dans la version d'expérimentation — Schéma montrant la sélection de caractéristiques par défaut

Confirmation de l'optimisation intelligente

Un panneau doit être ouvert sur le côté droit de la page pour configurer des paramètres supplémentaires. Nous voulons vérifier que l'optimisation de modèle intelligente est bien activée.

Procédez comme suit :

Si le panneau Configuration de l'expérimentation n'est pas ouvert, cliquez sur Afficher la configuration pour l'ouvrir.
Dans le panneau, développez Optimisation du modèle.
L'option d'optimisation sélectionnée doit être Intelligente.

Panneau Configuration de l'expérimentation affichant le paramètre Optimisation du modèle défini sur Intelligente — Confirmation que la version d'expérimentation est exécutée avec l'option d'optimisation Intelligente

Exécution de l'apprentissage

Cliquez sur Exécuter l'expérimentation dans le coin inférieur droit de la page pour démarrer l'apprentissage du modèle.

3e partie : Affichez les résultats

Une fois l'apprentissage terminé, l'onglet Modèles apparaît et s'ouvre. C'est là que vous pouvez voir les optimisations effectuées lors de l'apprentissage. Le modèle le plus performant, marqué d'une icône Trophée , est automatiquement sélectionné. Analysons ce modèle.

Consultez le Résumé de l'apprentissage du modèle. Il vous indique les résultats de l'optimisation intelligente pour ce modèle. Dans ce cas, nous pouvons voir que les caractéristiques suivantes ont été exclues et la raison pour laquelle elles l'ont été :

La caractéristique DaysSinceLastService a été exclue en raison d'un soupçon de fuite de la cible. Dans ce cas, la colonne contenait des données présentant une logique inappropriée. Les jours depuis le dernier ticket de service continuaient à être activement comptés pour les clients qui avaient annulé leur service (dans certains cas, il y a des années). Cette caractéristique devait être retirée, car elle aurait entraîné de faux scores de performances du modèle et aurait été responsable des très mauvaises performances du modèle s'il avait été déployé. Consultez Fuite de données
Les caractéristiques PriorPeriodUsage et PriorPeriodUsage-Rounded ont été exclues parce qu'elles étaient trop fortement corrélées avec une autre caractéristique. La caractéristique avec laquelle elles étaient corrélées a tout de même été incluse dans l'apprentissage. Consultez Corrélation.
Les caractéristiques CurrentPeriodUsage, CustomerTenure, StartMonth, Territory, DeviceType et StartWeek ont toutes été exclues en raison d'une faible permutation importance. Les caractéristiques qui ont un faible impact sur le modèle sont considérées comme des parasites statistiques et peuvent être retirées pour améliorer les performances. Consultez Familiarisation avec le concept de permutation importance.

Graphique Résumé de l'apprentissage du modèle le plus performant indiquant les caractéristiques exclues en raison d'une fuite de la cible, d'une forte corrélation et d'une faible permutation importance — Graphique Résumé de l'apprentissage du modèle montrant les caractéristiques exclues par l'optimisation intelligente

À présent que ces caractéristiques ont été retirées, nous pouvons voir des visualisations montrant les caractéristiques les plus influentes ainsi que certains indicateurs des performances prédictives du modèle. Les informations indiquées sur ces graphiques peuvent vous aider à déterminer s'il manque quelque chose dans l'ensemble de caractéristiques ou si les résultats sont faussés.

Pour plus d'informations sur l'analyse des modèles à l'aide de ces visualisations, consultez Réalisation d'une analyse de modèle rapide.

Approfondissement de l'analyse

Pour explorer davantage les métriques du modèle, accédez aux onglets Comparer et Analyser de l'expérimentation. Ces onglets vous offrent une vue interactive plus granulaire des métriques.

Pour plus d'informations, consultez Comparaison des modèles et Réalisation d'une analyse de modèle détaillée.

Étapes suivantes

Avec un jeu de données de grande qualité, l'optimisation intelligente crée des modèles prêts à être déployés avec peu d'itérations supplémentaires nécessaires, voire aucune. À partir de là, il est recommandé de déployer le modèle le plus performant. Sinon, vous pouvez continuer à affiner les modèles manuellement ou mettre à jour les données d'apprentissage et réexécuter l'optimisation de modèle intelligente.

Pour plus d'informations sur ces étapes, consultez :

Merci !

Vous avez terminé cet exemple. Nous espérons que vous avez compris comment utiliser l'optimisation de modèle intelligente pour effectuer facilement l'apprentissage de modèles d'apprentissage automatique prêts à être déployés.

Documentation et ressources supplémentaires

Qlik tient à votre disposition un large éventail de ressources d'information.
Une aide en ligne Qlik est disponible.
Des formations, y compris des cours en ligne gratuits, sont disponibles sur Qlik Learning.
Vous trouverez des forums de discussion, des blogs et bien plus encore dans Qlik Community.

Votre opinion compte

Nous apprécions tout commentaire de votre part. N'hésitez pas à utiliser la section ci-dessous pour nous faire part de vos commentaires.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !

Laissez vos commentaires ici