Configuration d'expérimentations
La configuration des expérimentations consiste à sélectionner la cible et les caractéristiques que le modèle utilisera pour prédire la cible. Vous pouvez également configurer un certain nombre de paramètres facultatifs.
Pour vous aider à sélectionner une cible, le jeu de données historique est analysé et des statistiques synthétiques sont affichées à propos de chaque colonne du jeu de données. Plusieurs étapes de prétraitement automatiques sont appliquées au jeu de données pour s'assurer que seules les données appropriées sont incluses. Pour des informations plus détaillées sur le prétraitement des données, voir Préparation et transformation automatiques des données.
Après avoir exécuté la version 1, vous pouvez créer de nouvelles versions d'expérimentation, si nécessaire, pour affiner davantage l'apprentissage du modèle. Pour plus d'informations, consultez Affinement des modèles.
Conditions requises et autorisations
Pour en savoir plus sur les conditions requises de la part des utilisateurs pour pouvoir utiliser des expérimentations ML, voir Utilisation d'expérimentations.
L'interface
Les sections suivantes expliquent comment naviguer dans l'interface d'expérimentation pour configurer votre expérimentation. Pour plus d'informations sur l'interface, consultez Navigation dans l'interface d'expérimentation.
Navigation par onglets
Lorsque vous créez une expérimentation, l'onglet Données s'ouvre. C'est là que vous pouvez configurer la cible et les caractéristiques de l'expérimentation.
Une fois que vous avez exécuté au moins une version d'expérimentation, d'autres onglets deviennent disponibles. Ces autres onglets vous permettent d'analyser les modèles dont vous venez d'effectuer l'apprentissage dans la version. Si vous devez configurer des versions ultérieures avec des sélections de caractéristiques différentes, vous pouvez revenir à l'onglet Données.
Vue Schéma et Vue Données
Dans l'onglet Données, vous pouvez alterner entre les vues suivantes :
-
Vue Schéma : vue par défaut. Dans cette vue, chaque colonne de votre jeu de données est représentée par une ligne dans le schéma avec des informations et des statistiques.
-
Vue Données : vue alternative que vous pouvez utiliser pour accéder à davantage d'informations et d'échantillons de données pour chaque colonne.
Panneau Configuration de l'expérimentation
Cliquez sur Afficher la configuration pour ouvrir un panneau dans lequel vous pouvez davantage personnaliser l'apprentissage de l'expérimentation. Le panneau peut être ouvert quel que soit l'onglet dans lequel vous vous trouvez. Ce panneau fournit un certain nombre d'options de configuration supplémentaires.
Avec le panneau Configuration de l'expérimentation, vous pouvez effectuer les opérations suivantes :
-
Sélectionner une cible avant d'effectuer l'apprentissage de la première version
-
Ajouter ou retirer des caractéristiques
-
Configurer une nouvelle version de l'expérimentation
-
Sélectionner pour modifier ou actualiser l'ensemble de données d'apprentissage
-
Ajouter ou retirer des algorithmes
-
Modifier les paramètres d'optimisation du modèle
Sélection d'une cible
La colonne cible contient les valeurs que vous voulez que le modèle d'apprentissage automatique prédise. Vous pouvez modifier la colonne cible jusqu'au moment où vous démarrez le premier apprentissage. Ensuite, elle sera verrouillée et vous ne pourrez plus la modifier.
Procédez comme suit :
Dans la Vue Schéma ou la Vue Données, survolez la colonne.
Cliquez sur l'icône qui apparaît.
La colonne cible est à présent indiquée par l'icône et les autres colonnes disponibles sont automatiquement sélectionnées comme des caractéristiques.
Sinon, vous pouvez sélectionner la cible dans le panneau Configuration de l'apprentissage.
Lorsque la cible est sélectionnée, vous pouvez commencer à exécuter la première version de l'expérimentation. En savoir plus à la section Formation d'expérimentations. À ce stade, vous pouvez configurer d'autres paramètres, décrits ci-dessous, ou vous pouvez ajuster la configuration une fois que vous avez étudié les résultats d'apprentissage.
Les explications sur la manière dont vos données sont interprétées et traitées sont affichées à mesure de la poursuite de l'apprentissage de l'expérimentation. Pour plus d'informations, consultez Interprétation des informations analytiques d'un jeu de données.
Détermination du type de modèle créé
La colonne que vous sélectionnez comme cible détermine le type de modèle créé par votre expérimentation. Cela, à son tour, joue un rôle dans la détermination des algorithmes utilisés pour former le modèle. Il se peut que certaines colonnes de votre jeu de données ne puissent pas être sélectionnées comme cible pour votre expérimentation, ou qu'un traitement spécifique leur soit appliqué.
Les types de modèle sont les suivants :
Modèle de classification binaire
Modèle de classification multiclasse
Modèle de régression
Le tableau ci-dessous résume les facteurs de votre cible qui déterminent le type de modèle utilisé.
Type de modèle | Nombre de valeurs distinctes dans la colonne | Type de caractéristiques requis | Informations supplémentaires |
---|---|---|---|
Classification binaire | 2 | N'importe lequel | - |
Classification multiclasse | 3-10 | N'importe lequel | Il n'est pas possible de sélectionner comme cible une colonne avec plus de 10 classes non-numériques distinctes. |
Régression | Plus de 10 | Numérique | - |
Pour savoir pour quel type de modèles votre expérimentation effectue l'apprentissage, cliquez sur Afficher la configuration et développez Algorithmes. Le type de modèle est visible dans le titre de la section.
Sélection de colonnes de caractéristiques
Une fois la cible définie, vous pouvez sélectionner parmi les autres colonnes disponibles celles à inclure dans l'apprentissage du modèle. Excluez toutes les caractéristiques que vous ne souhaitez pas inclure dans le modèle. Notez que la colonne restera dans le jeu de données, mais qu'elle ne sera pas utilisée par l'algorithme d'apprentissage.
Tout en haut du volet Configuration de l'expérimentation, vous pouvez voir le nombre de cellules de votre jeu de données. Si le nombre dépasse la limite de votre jeu de données, vous pouvez exclure des caractéristiques pour que ce nombre soit inférieur à la limite.
Vous pouvez sélectionner les colonnes de caractéristiques de différentes manières :
Dans la Vue Schéma et dans la Vue Données
Dans les vues principales, vous pouvez effectuer les opérations suivantes :
Désélectionnez Inclure l'ensemble des caractéristiques disponibles et sélectionnez uniquement celles à inclure.
Décochez manuellement les cases des caractéristiques que vous souhaitez exclure.
Lancez une recherche et excluez ou incluez toutes les caractéristiques du résultat de recherche filtré.
Dans le panneau Personnalisation de l'apprentissage
Si vous développez le panneau Configuration de l'expérimentation, vous pouvez effectuer les opérations suivantes :
Décochez manuellement les cases des caractéristiques que vous souhaitez exclure.
Après avoir exécuté la première version de l'expérimentation, vous pouvez définir le Nombre de principales caractéristiques à inclure.
Lorsque vous sélectionnez des caractéristiques, celles-ci se voient automatiquement attribuer un type de caractéristique. Les types de caractéristique possibles sont les suivants :
Catégorique
Numérique
Date
Texte libre
Le type de caractéristique est attribué en fonction des données contenues dans la colonne de caractéristique. Si une caractéristique remplit certains critères, elle peut être mise de côté pour servir de base à des caractéristiques auto-conçues. Si vous le souhaitez, vous pouvez décider d'utiliser la caractéristique dans le cadre de l'ingénierie automatique des caractéristiques. Pour des informations détaillées complète sur l'ingénierie automatique des caractéristiques, voir Ingénierie automatique des caractéristiques.
Il se peut que certaines colonnes de votre jeu de données ne puissent pas être sélectionnées comme caractéristiques pour votre expérimentation, ou qu'un traitement spécifique leur soit appliqué. Les explications sur la manière dont vos données sont interprétées et traitées sont affichées lorsque vous naviguez dans l'apprentissage de l'expérimentation. Pour plus d'informations, consultez Interprétation des informations analytiques d'un jeu de données.
Sélection d'algorithmes
Tous les algorithmes disponibles sont inclus par défaut et vous pouvez exclure tous ceux que vous ne souhaitez pas utiliser. Vous le faites normalement dans le cadre de l'affinement du modèle, une fois que vous avez vu les premiers résultats d'apprentissage. En savoir plus à la section Affinement des modèles.
Modification des types de caractéristiques
Lorsqu'un jeu de données est chargé, les colonnes sont traitées comme étant de type catégorique, numérique, date ou texte libre, en fonction du type de données et d'autres caractéristiques. Dans certains cas, vous pouvez souhaiter modifier ce réglage.
Par exemple, si les jours de la semaine sont représentés par les chiffres 1 à 7, chaque chiffre représente une valeur catégorique. Par défaut, ces chiffres sont traités comme des valeurs numériques classées continues. Par conséquent, vous devez manuellement modifier la configuration pour qu'ils soient traités comme des valeurs catégoriques.
Lorsqu'une colonne est identifiée comme contenant des informations de date et d'heure, elle sert de base pour la création de nouvelles caractéristiques auto-conçues générées. Lorsque cela se produit, la colonne d'origine (la caractéristique parente) est traitée comme ayant le type de caractéristique de date.
Vous pouvez modifier la caractéristique parente en remplaçant son type date par le type de caractéristique catégorique ou numérique. Par exemple, cela s'avère utile lorsqu'une caractéristique est identifiée comme une date, mais que vous avez besoin qu'elle soit traitée comme une chaîne ou un nombre. Si vous faites cela, vous ne pourrez plus utiliser ses caractéristiques auto-conçues lors de l'apprentissage de l'expérimentation.
Procédez comme suit :
Dans Vue Schéma, recherchez la caractéristique.
Dans la colonne Type de caractéristique de cette caractéristique, cliquez sur .
Sélectionnez une valeur dans la liste.
Sinon, vous pouvez changer de type de caractéristique depuis la Vue Données. Recherchez la caractéristique, puis cliquez sur à côté du type de caractéristique actif. Sélectionnez une valeur dans la liste.
Vous pouvez voir toutes les colonnes dont le type de caractéristique a été modifié dans le panneau Configuration de l'expérimentation sous Traitement des données.
Impact sur les prévisions
Lorsque vous modifiez manuellement le type d'une caractéristique, puis que vous déployez un modèle résultant, les modifications apportées au type de caractéristique seront appliquées à la caractéristique dans le jeu de données d'application qui est utilisé dans les prédictions effectuées avec ce modèle.
Modification du jeu de données
Vous pouvez modifier le jeu de données d'apprentissage avant d'exécuter la première version d'expérimentation, ainsi qu'après avoir exécuté toute version.
Si vous modifiez le jeu de données avant d'exécuter la première version, vous perdrez toute configuration effectuée avant de modifier le jeu de données.
Procédez comme suit :
Dans le panneau Configuration de l'expérimentation sous Données d'apprentissage, cliquez sur Modifier le jeu de données.
Sélectionnez un nouveau jeu de données.
Pour plus d'informations sur la modification et l'actualisation du jeu de données lors de l'affinement du modèle (après l'exécution d'une version d'expérimentation), consultez Modification et actualisation du jeu de données.
Configuration de l'optimisation de modèle
Il est possible de personnaliser les paramètres suivants pour optimiser les modèles :
en activant ou désactivant l'optimisation de modèle intelligente ;
en activant ou désactivant l'optimisation des hyperparamètres.
Désactivation ou activation de l'apprentissage temporel
Il est possible d'activer ou de désactiver ces options pour chaque version de l'expérimentation que vous exécutez.
Configuration de l'optimisation intelligente
Par défaut, l'expérimentation utilise l'optimisation de modèle intelligente. Grâce à l'optimisation de modèle intelligente, AutoML gère pour vous le processus d'affinement de modèle via l'itération d'une sélection de caractéristiques et l'application de transformations avancées à vos données.
Pour plus d'informations sur l'optimisation intelligente, consultez Optimisation de modèle intelligente.
Vous pouvez désactiver ce paramètre pour affiner manuellement les modèles dont vous effectuez l'apprentissage. Pour exemple, vous pouvez vouloir commencer l'apprentissage de votre modèle avec l'optimisation de modèle intelligente, puis passer à l'affinement manuel pour la v2 pour ajuster davantage la configuration.
Procédez comme suit :
Cliquez sur Afficher la configuration.
Si vous avez déjà exécuté au moins une version de l'expérimentation, cliquez sur Nouvelle version.
Dans le panneau, développez Optimisation du modèle.
Passez de Intelligente à Manuelle.
À l'aide du curseur, définissez la durée d'exécution maximale de l'apprentissage.
Configuration de l'optimisation des hyperparamètres
Vous pouvez optimiser les modèles à l'aide de l'optimisation des hyperparamètres. Notez qu'il s'agit d'une option avancée susceptible d'augmenter considérablement la durée d'apprentissage. L'optimisation des hyperparamètres est disponible si vous désactivez l'optimisation intelligente.
Pour plus d'informations, consultez Optimisation des hyperparamètres.
Procédez comme suit :
Cliquez sur Afficher la configuration.
Si vous avez déjà exécuté au moins une version de l'expérimentation, cliquez sur Nouvelle version.
Dans le panneau, développez Optimisation du modèle.
Passez de Intelligente à Manuelle.
Cochez la case Optimisation des hyperparamètres.
Vous pouvez éventuellement définir une limite temporelle pour votre optimisation. La limite temporelle par défaut est d'une heure.
Configuration de l'apprentissage temporel
Si vous souhaitez que vos modèles fassent l'objet d'un apprentissage en tenant compte d'une dimension Série chronologique, activez l'apprentissage temporel pour la version d'expérimentation. Pour utiliser cette option, vous devez disposer dans votre jeu de données d'une colonne contenant les informations de série chronologique pertinentes.
Lorsque l'apprentissage temporel est activé, AutoML utilise des processus de validation croisée et d'imputation des valeurs nulles spécialisés pour effectuer l'apprentissage des modèles.
Pour plus d'informations, consultez Création de modèles temporels et Validation croisée basée sur le temps.
Procédez comme suit :
Cliquez sur Afficher la configuration.
Si vous avez déjà exécuté au moins une version de l'expérimentation, cliquez sur Nouvelle version.
Dans le panneau, développez Optimisation du modèle.
Sous Test-train split basé sur le temps, sélectionnez l'Index de date à utiliser pour trier les données.
Affichage d'informations analytiques sur les données d'apprentissage
Dans l'onglet Données de l'expérimentation, vous pouvez afficher des informations analytiques sur le traitement des données d'apprentissage. Ces informations sont disponibles dans la colonne Informations de la Vue Schéma. Les informations affichées dépendent de l'exécution ou non d'une version avec les données d'apprentissage actuelles. Les modifications apportées à la colonne Informations peuvent vous aider à identifier la raison pour laquelle certaines caractéristiques ne peuvent pas être utilisées ou ont été automatiquement exclues.
Pour plus d'informations sur la signification de chaque information, consultez Interprétation des informations analytiques d'un jeu de données.