Accéder au contenu principal Passer au contenu complémentaire

Configuration d'expérimentations

La configuration des expérimentations consiste à sélectionner la cible et les caractéristiques que le modèle utilisera pour prédire la cible. Vous pouvez également configurer un certain nombre de paramètres facultatifs.

Pour vous aider à sélectionner une cible, l'ensemble de données historique est analysé et des statistiques synthétiques sont affichées à propos de chaque colonne de l'ensemble de données. Plusieurs étapes de prétraitement automatiques sont appliquées à l'ensemble de données pour s'assurer que seules les données appropriées sont incluses. Pour des informations plus détaillées sur le prétraitement des données, voir Préparation et transformation automatiques des données.

Vues

La vue par défaut est la vue Schéma, dans laquelle chaque colonne de votre ensemble de données est représentée par une ligne dans le schéma avec des informations et des statistiques. Pour obtenir plus d'informations et des échantillons de données pour chaque colonne, vous disposez également de la vue Données. Cliquez sur Colonnes et sur Vue Données pour passer d'une vue à une autre.

Aperçu de l'ensemble de données affiché dans la vue Schéma

Vue Schéma AutoML.

Aperçu de l'ensemble de données affiché dans la vue Données

Vue Données AutoML.

Cliquez sur Volet Configuration pour ouvrir ou fermer le volet latéral Configuration de l'expérimentation. Ici, vous trouverez des informations sur votre expérimentation et la configuration existante.

Le volet latéral montre la configuration de l'expérimentation pour la version active

Volet latéral Configuration de l'expérimentation AutoML.

Sélection d'une cible

La colonne cible contient les valeurs que vous voulez que le modèle d'apprentissage machine prédise. Vous pouvez modifier la colonne cible jusqu'au moment où vous démarrez le premier apprentissage ; ensuite, elle sera verrouillée et vous ne pourrez plus l'éditer.

  • Survolez la colonne à l'aide de la souris et cliquez sur l'icône Cible qui apparaît.

    La colonne cible est à présent indiquée par l'icône Cible et les autres colonnes disponibles sont automatiquement sélectionnées comme des caractéristiques.

Sélection de la cible

Colonne d'ensemble de données avec le symbole de cible.

Lorsque la cible est sélectionnée, vous pouvez commencer à exécuter la première version de l'expérimentation. En savoir plus à la section Formation d'expérimentations. À ce stade, vous pouvez configurer d'autres paramètres, décrits ci-dessous, ou vous pouvez ajuster la configuration une fois que vous avez étudié les résultats d'apprentissage.

Il se peut que certaines colonnes de votre ensemble de données ne puissent pas être sélectionnées comme cible pour votre expérimentation, ou qu'un traitement spécifique leur soit appliqué. Pour des explications sur les caractéristiques courantes détectées dans les données d'apprentissage, voir Configuration d'expérimentations.

Sélection de colonnes de caractéristiques

Une fois la cible définie, vous pouvez sélectionner parmi les autres colonnes disponibles celles à inclure dans l'apprentissage du modèle. Excluez toutes les caractéristiques que vous ne souhaitez pas inclure dans le modèle. Notez que la colonne restera dans l'ensemble de données, mais qu'elle ne sera pas utilisée par l'algorithme d'apprentissage.

Tout en haut du volet Configuration de l'expérimentation, vous pouvez voir le nombre de cellules de votre ensemble de données. Si le nombre dépasse la limite de votre ensemble de données, vous pouvez exclure des caractéristiques pour que ce nombre soit inférieur à la limite.

Vous pouvez sélectionner les colonnes de caractéristiques de différentes manières :

  • Décochez manuellement les cases des caractéristiques que vous souhaitez exclure.

  • Cliquez sur Exclure toutes les caractéristiques et sélectionnez uniquement celles à inclure.

  • Lancez une recherche et excluez ou incluez toutes les caractéristiques du résultat de recherche filtré.

  • Après avoir exécuté la première version de l'expérimentation, vous pouvez définir le Nombre de principales caractéristiques à inclure.

Section Caractéristiques de Configuration de l'expérimentation

Section Caractéristiques du volet latéral Configuration de l'expérimentation AutoML.

Il se peut que certaines colonnes de votre ensemble de données ne puissent pas être sélectionnées comme caractéristiques pour votre expérimentation, ou qu'un traitement spécifique leur soit appliqué. Pour des explications sur les caractéristiques courantes détectées dans les données d'apprentissage, voir Configuration d'expérimentations.

Sélection d'algorithmes

Tous les algorithmes disponibles sont inclus par défaut et vous pouvez exclure tous ceux que vous ne souhaitez pas utiliser. Vous le faites normalement dans le cadre de l'affinement du modèle, une fois que vous avez vu les premiers résultats d'apprentissage. En savoir plus à la section Affinement des modèles.

Section Algorithmes de Configuration de l'expérimentation

Section Algorithmes du volet latéral Configuration de l'expérimentation AutoML.

Modification des types de données des caractéristiques

Lors du chargement d'un ensemble de données, les colonnes sont traitées comme des colonnes catégoriques ou numériques en fonction du type des données. Dans certains cas, vous pouvez souhaiter modifier ce réglage.

Par exemple, si les jours de la semaine sont représentés par les chiffres 1 à 7, chaque chiffre représente une valeur catégorique. Par défaut, ces chiffres sont traités comme des valeurs numériques classées continues. Par conséquent, vous devez manuellement modifier la configuration pour qu'ils soient traités comme des valeurs catégoriques.

  1. Dans la colonne Type de caractéristique, cliquez sur .

  2. Sélectionnez une valeur dans la liste.

Vous pouvez voir toutes les colonnes dont le type de caractéristique a été modifié dans le volet Configuration de l'expérimentation sous Traitement des données.

Modification de l'ensemble de données

Avant d'exécuter le premier apprentissage de votre expérimentation, vous avez la possibilité de modifier l'ensemble de données. Ensuite, si vous souhaitez utiliser un ensemble de données différent, vous devrez créer une nouvelle expérimentation. Notez que, si vous modifiez l'ensemble de données, vous perdrez toute les configurations que vous avez effectuées.

  1. Dans le volet Configuration de l'expérimentation sous Données d'apprentissage, cliquez sur Modifier l'ensemble de données.

  2. Sélectionnez un nouvel ensemble de données.

Configuration de l'optimisation des hyperparamètres

Vous pouvez optimiser le modèle à l'aide de l'optimisation des hyperparamètres. Notez qu'il s'agit d'une option avancée susceptible d'augmenter considérablement la durée d'apprentissage. Pour plus d'informations, voir Optimisation des hyperparamètres.

Section Optimisation du modèle de Configuration de l'expérimentation

Section Optimisation du modèle du volet latéral Configuration de l'expérimentation AutoML.
  1. Dans le volet Configuration de l'expérimentation, développez la section Optimisation du modèle.

  2. Cochez la case Optimisation des hyperparamètres.

  3. Vous pouvez éventuellement définir une limite temporelle pour votre optimisation. La limite temporelle par défaut est d'une heure.

Informations courantes trouvées dans les données d'apprentissage

Suivant la qualité de votre ensemble de données, la manière dont vous pouvez utiliser des parties spécifiques des données dans la configuration de votre expérimentation peut être limitée. La colonne Informations de la vue Schéma permet d'identifier les caractéristiques particulières des champs de données et la manière dont elles seront traitées par les algorithmes d'apprentissage machine.

Le tableau suivant indique les informations possibles susceptibles d'apparaître dans le schéma :

Informations de l'ensemble de données dans la vue Schéma
Information Signification Impact sur la configuration
Constante La colonne contient la même valeur pour toutes les lignes. La colonne ne peut pas être utilisée comme cible ni comme caractéristique incluse.
Encodage one-hot Le type de caractéristique est catégorique et la colonne comporte moins de 14 valeurs uniques. Aucun effet sur la configuration.
Impact encoding Le type de caractéristique est catégorique et la colonne comporte au moins 14 valeurs uniques. Aucun effet sur la configuration.
Cardinalité élevée La colonne comporte un trop grand nombre de valeurs uniques et peut affecter négativement les performances du modèle si elle est utilisée comme caractéristique. La colonne ne peut pas être utilisée comme cible.
Données clairsemées La colonne comporte un trop grand nombre de valeurs nulles. La colonne ne peut pas être utilisée comme cible ni comme caractéristique incluse.
Classe sous-représentée La colonne a une classe de moins de 10 lignes. La colonne ne peut pas être utilisée comme cible, mais elle peut être incluse comme caractéristique.

En savoir plus

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !