Accéder au contenu principal Passer au contenu complémentaire

Configuration d'expérimentations

La configuration des expérimentations consiste à sélectionner la cible et les caractéristiques que le modèle utilisera pour prédire la cible. Vous pouvez également configurer un certain nombre de paramètres facultatifs.

Pour vous aider à sélectionner une cible, l'ensemble de données historique est analysé et des statistiques synthétiques sont affichées à propos de chaque colonne de l'ensemble de données. Plusieurs étapes de prétraitement automatiques sont appliquées à l'ensemble de données pour s'assurer que seules les données appropriées sont incluses. Pour des informations plus détaillées sur le prétraitement des données, voir Préparation et transformation automatiques des données.

Après avoir exécuté la version 1, vous pouvez créer de nouvelles versions d'expérimentation, si nécessaire, pour affiner davantage l'apprentissage du modèle. Pour plus d'informations, voir Affinement des modèles.

Conditions requises et autorisations

Pour en savoir plus sur les conditions requises de la part des utilisateurs pour pouvoir utiliser des expérimentations ML, voir Utilisation d'expérimentations.

Vues

La vue par défaut est la vue Schéma, dans laquelle chaque colonne de votre ensemble de données est représentée par une ligne dans le schéma avec des informations et des statistiques. Pour obtenir plus d'informations et des échantillons de données pour chaque colonne, vous disposez également de la vue Données. Cliquez sur Colonnes et sur Vue Données pour passer d'une vue à une autre.

Aperçu de l'ensemble de données affiché dans la vue Schéma

Vue Schéma AutoML.

Aperçu de l'ensemble de données affiché dans la vue Données

Vue Données AutoML.

Cliquez sur Volet Configuration pour ouvrir ou fermer le volet latéral Configuration de l'expérimentation. Ici, vous trouverez des informations sur votre expérimentation et la configuration existante.

Le volet latéral montre la configuration de l'expérimentation pour la version active

Volet latéral Configuration de l'expérimentation AutoML.

Sélection d'une cible

La colonne cible contient les valeurs que vous voulez que le modèle d'apprentissage automatique prédise. Vous pouvez modifier la colonne cible jusqu'au moment où vous démarrez le premier apprentissage. Ensuite, elle sera verrouillée et vous ne pourrez plus l'éditer.

  • Survolez la colonne à l'aide de la souris et cliquez sur l'icône Cible qui apparaît.

    La colonne cible est à présent indiquée par l'icône Cible et les autres colonnes disponibles sont automatiquement sélectionnées comme des caractéristiques.

Sélection de la cible

Colonne d'ensemble de données avec le symbole de cible.

Lorsque la cible est sélectionnée, vous pouvez commencer à exécuter la première version de l'expérimentation. En savoir plus à la section Formation d'expérimentations. À ce stade, vous pouvez configurer d'autres paramètres, décrits ci-dessous, ou vous pouvez ajuster la configuration une fois que vous avez étudié les résultats d'apprentissage.

Les explications sur la manière dont vos données sont interprétées et traitées sont affichées lorsque vous naviguez dans l'apprentissage de l'expérimentation. Pour plus d'informations, voir Informations courantes trouvées dans les données d'apprentissage.

Détermination du type de modèle créé

La colonne que vous sélectionnez comme cible détermine le type de modèle créé par votre expérimentation. Cela, à son tour, joue un rôle dans la détermination des algorithmes utilisés pour former le modèle. Il se peut que certaines colonnes de votre ensemble de données ne puissent pas être sélectionnées comme cible pour votre expérimentation, ou qu'un traitement spécifique leur soit appliqué.

Les types de modèle sont les suivants :

  • Modèle de classification binaire

  • Modèle de classification multiclasse

  • Modèle de régression

Le tableau ci-dessous résume les facteurs de votre cible qui déterminent le type de modèle utilisé.

Caractéristiques de la colonne cible qui déterminent le type de modèle
Type de modèle Nombre de valeurs distinctes dans la colonne Type de caractéristiques requis Informations supplémentaires
Classification binaire 2 N'importe lequel -
Classification multiclasse 3-10 N'importe lequel Il n'est pas possible de sélectionner comme cible une colonne avec plus de 10 classes non-numériques distinctes.
Régression Plus de 10 Numérique -

Sélection de colonnes de caractéristiques

Une fois la cible définie, vous pouvez sélectionner parmi les autres colonnes disponibles celles à inclure dans l'apprentissage du modèle. Excluez toutes les caractéristiques que vous ne souhaitez pas inclure dans le modèle. Notez que la colonne restera dans l'ensemble de données, mais qu'elle ne sera pas utilisée par l'algorithme d'apprentissage.

Tout en haut du volet Configuration de l'expérimentation, vous pouvez voir le nombre de cellules de votre ensemble de données. Si le nombre dépasse la limite de votre ensemble de données, vous pouvez exclure des caractéristiques pour que ce nombre soit inférieur à la limite.

Vous pouvez sélectionner les colonnes de caractéristiques de différentes manières :

  • Décochez manuellement les cases des caractéristiques que vous souhaitez exclure.

  • Cliquez sur Exclure toutes les caractéristiques et sélectionnez uniquement celles à inclure.

  • Lancez une recherche et excluez ou incluez toutes les caractéristiques du résultat de recherche filtré.

  • Après avoir exécuté la première version de l'expérimentation, vous pouvez définir le Nombre de principales caractéristiques à inclure.

Section Caractéristiques de Configuration de l'expérimentation

Section Caractéristiques du volet latéral Configuration de l'expérimentation AutoML.

Lorsque vous sélectionnez des caractéristiques, celles-ci se voient automatiquement attribuer un type de caractéristique. Les types de caractéristique possibles sont les suivants :

  • Catégorique

  • Numérique

  • date

  • Texte libre

Le type de caractéristique est attribué en fonction des données contenues dans la colonne de caractéristique. Si une caractéristique remplit certains critères, elle peut être mise de côté pour servir de base à des caractéristiques auto-conçues. Si vous le souhaitez, vous pouvez décider d'utiliser la caractéristique dans le cadre de l'ingénierie automatique des caractéristiques. Pour des informations détaillées complète sur l'ingénierie automatique des caractéristiques, voir Ingénierie automatique des caractéristiques.

Il se peut que certaines colonnes de votre ensemble de données ne puissent pas être sélectionnées comme caractéristiques pour votre expérimentation, ou qu'un traitement spécifique leur soit appliqué. Les explications sur la manière dont vos données sont interprétées et traitées sont affichées lorsque vous naviguez dans l'apprentissage de l'expérimentation. Pour plus d'informations, voir Informations courantes trouvées dans les données d'apprentissage.

Sélection d'algorithmes

Tous les algorithmes disponibles sont inclus par défaut et vous pouvez exclure tous ceux que vous ne souhaitez pas utiliser. Vous le faites normalement dans le cadre de l'affinement du modèle, une fois que vous avez vu les premiers résultats d'apprentissage. En savoir plus à la section Affinement des modèles.

Section Algorithmes de Configuration de l'expérimentation

Section Algorithmes du volet latéral Configuration de l'expérimentation AutoML.

Modification des types de caractéristiques

Lorsqu'un ensemble de données est chargé, les colonnes sont traitées comme étant de type catégorique, numérique, date ou texte libre, en fonction du type de données et d'autres particularités. Dans certains cas, il peut être préférable de modifier ce paramètre.

Par exemple, si les jours de la semaine sont représentés par les chiffres 1 à 7, chaque chiffre représente une valeur catégorique. Par défaut, ces chiffres sont traités comme des valeurs numériques classées continues. Par conséquent, vous devez manuellement modifier la configuration pour qu'ils soient traités comme des valeurs catégoriques. Vous avez également la possibilité de convertir un type de caractéristique catégorique en type de caractéristique numérique.

Lorsqu'une colonne est identifiée comme contenant des informations de date et d'heure, elle sert de base pour la création de nouvelles caractéristiques auto-conçues générées. Lorsque cela se produit, la colonne d'origine (la caractéristique parente) est traitée comme ayant le type de caractéristique de date. Vous pouvez modifier la caractéristique parente d'un type de caractéristique de date à un type de caractéristique catégorique. Cependant, si vous faites cela, vous ne pourrez plus utiliser ses caractéristiques auto-conçues lors de l'entraînement de l'expérimentation.

  1. Dans la colonne Type de caractéristique, cliquez sur .

  2. Sélectionnez une valeur dans la liste.

Vous pouvez voir toutes les colonnes dont le type de caractéristique a été modifié dans le volet Configuration de l'expérimentation sous Traitement des données.

Modification de l'ensemble de données

Vous pouvez modifier l'ensemble de données d'apprentissage avant d'exécuter la première version d'expérimentation, ainsi qu'après avoir exécuté toute version.

Si vous modifiez l'ensemble de données avant d'exécuter la première version, vous perdrez toute configuration effectuée avant de modifier l'ensemble de données.

  1. Dans le volet Configuration de l'expérimentation sous Données d'apprentissage, cliquez sur Modifier l'ensemble de données.

  2. Sélectionnez un nouvel ensemble de données.

Pour plus d'informations sur la modification et l'actualisation de l'ensemble de données lors de l'affinement du modèle (après l'exécution d'une version d'expérimentation), voir Modification et actualisation de l'ensemble de données.

Configuration de l'optimisation des hyperparamètres

Vous pouvez optimiser le modèle à l'aide de l'optimisation des hyperparamètres. Notez qu'il s'agit d'une option avancée susceptible d'augmenter considérablement la durée d'apprentissage. Pour plus d'informations, voir Optimisation des hyperparamètres.

Section Optimisation du modèle de Configuration de l'expérimentation

Section Optimisation du modèle du volet latéral Configuration de l'expérimentation AutoML.
  1. Dans le volet Configuration de l'expérimentation, développez la section Optimisation du modèle.

  2. Cochez la case Optimisation des hyperparamètres.

  3. Vous pouvez éventuellement définir une limite temporelle pour votre optimisation. La limite temporelle par défaut est d'une heure.

Informations courantes trouvées dans les données d'apprentissage

Suivant la qualité de votre ensemble de données, la manière dont vous pouvez utiliser des parties spécifiques des données dans la configuration de votre expérimentation peut être limitée. La colonne Informations de la vue Schéma permet d'identifier les caractéristiques particulières des champs de données et la manière dont elles seront traitées par les algorithmes d'apprentissage automatique.

Le tableau suivant indique les informations possibles susceptibles d'apparaître dans le schéma :

Informations de l'ensemble de données dans la vue Schéma
InformationSignificationImpact sur la configuration
ConstanteLa colonne contient la même valeur pour toutes les lignes.La colonne ne peut pas être utilisée comme cible ni comme caractéristique incluse.
Encodage one-hotLe type de caractéristique est catégorique et la colonne comporte moins de 14 valeurs uniques.Aucun effet sur la configuration.
Impact encodingLe type de caractéristique est catégorique et la colonne comporte au moins 14 valeurs uniques.Aucun effet sur la configuration.
Cardinalité élevéeLa colonne comporte un trop grand nombre de valeurs uniques et peut affecter négativement les performances du modèle si elle est utilisée comme caractéristique.La colonne ne peut pas être utilisée comme cible. Elle sera automatiquement exclue en tant que caractéristique, mais elle peut tout de même être incluse, si nécessaire.
Données clairseméesLa colonne comporte un trop grand nombre de valeurs nulles.La colonne ne peut pas être utilisée comme cible ni comme caractéristique incluse.
Classe sous-représentéeLa colonne a une classe de moins de 10 lignes.La colonne ne peut pas être utilisée comme cible, mais elle peut être incluse comme caractéristique.
<nombre de> caractéristiques auto-conçuesLa colonne est la caractéristique parente qui peut être utilisée pour générer des caractéristiques auto-conçues.Si cette caractéristique parente est interprétée comme une caractéristique de date, elle est automatiquement supprimée de la configuration. Il est recommandé d'utiliser plutôt les caractéristiques de date auto-conçues qui peuvent être générées à partir de celle-ci. Il est possible d'outrepasser ce paramètre et d'inclure la caractéristique au lieu des caractéristiques auto-conçues.
Caractéristique auto-conçueLa colonne est une caractéristique auto-conçue qui peut être générée à partir d'une caractéristique de date parente, ou qui l'a été. Elle n'apparaissait pas dans l'ensemble de données d'origine.Vous pouvez supprimer une ou plusieurs de ces caractéristiques auto-conçues pendant l'apprentissage de votre expérimentation. Si vous modifiez le type de caractéristique de la caractéristique parente en catégorique, toutes les caractéristiques auto-conçues sont supprimées.
Impossible de traiter comme dateLa colonne inclut éventuellement des informations de date et d'heure, mais n'a pas pu être utilisée pour créer des caractéristiques de date auto-conçues.La caractéristique est retirée de la configuration. Si des caractéristiques auto-conçues ont été précédemment générées à partir de cette caractéristique parente, elles sont supprimées des futures versions de l'expérimentation. Vous pouvez toujours utiliser la caractéristique dans l'expérimentation, mais vous devez changer son type de caractéristique en catégorique.
Texte libre possibleIl se peut que la colonne puisse être utilisée comme une caractéristique de type texte libre.Le type de caractéristique Texte libre est attribué à la colonne. Vous devez exécuter une version d'expérimentation pour vérifier si la caractéristique peut être traitée sous forme de texte libre.
Texte libreLa colonne a été confirmée comme contenant un texte libre. Elle peut être traitée sous forme de texte libre.Aucune configuration supplémentaire de la caractéristique n'est nécessaire.
Impossible de traiter comme texte libreUne analyse plus poussée confirme que la colonne ne peut pas être traitée sous forme de texte libre.Vous devez désélectionner la caractéristique de la configuration pour la version d'expérimentation suivante. Sinon, si la caractéristique ne présente pas de forte cardinalité, vous pouvez remplacer le type de caractéristique par Catégorique.

En savoir plus

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !