Configuration d'expérimentations
La configuration des expérimentations consiste à sélectionner la cible et les caractéristiques que le modèle utilisera pour prédire la cible. Vous pouvez également configurer un certain nombre de paramètres facultatifs.
Pour vous aider à sélectionner une cible, l'ensemble de données historique est analysé et des statistiques synthétiques sont affichées à propos de chaque colonne de l'ensemble de données. Plusieurs étapes de prétraitement automatiques sont appliquées à l'ensemble de données pour s'assurer que seules les données appropriées sont incluses. Pour des informations plus détaillées sur le prétraitement des données, voir Préparation et transformation automatiques des données.
Vues
La vue par défaut est la vue Schéma, dans laquelle chaque colonne de votre ensemble de données est représentée par une ligne dans le schéma avec des informations et des statistiques. Pour obtenir plus d'informations et des échantillons de données pour chaque colonne, vous disposez également de la vue Données. Cliquez sur et sur
pour passer d'une vue à une autre.
Aperçu de l'ensemble de données affiché dans la vue Schéma

Aperçu de l'ensemble de données affiché dans la vue Données

Cliquez sur pour ouvrir ou fermer le volet latéral Configuration de l'expérimentation. Ici, vous trouverez des informations sur votre expérimentation et la configuration existante.
Le volet latéral montre la configuration de l'expérimentation pour la version active

Sélection d'une cible
La colonne cible contient les valeurs que vous voulez que le modèle d'apprentissage machine prédise. Vous pouvez modifier la colonne cible jusqu'au moment où vous démarrez le premier apprentissage ; ensuite, elle sera verrouillée et vous ne pourrez plus l'éditer.
Procédez comme suit :
-
Survolez la colonne à l'aide de la souris et cliquez sur l'icône
qui apparaît.
La colonne cible est à présent indiquée par l'icône
et les autres colonnes disponibles sont automatiquement sélectionnées comme des caractéristiques.
Sélection de la cible

Lorsque la cible est sélectionnée, vous pouvez commencer à exécuter la première version de l'expérimentation. En savoir plus à la section Formation d'expérimentations. À ce stade, vous pouvez configurer d'autres paramètres, décrits ci-dessous, ou vous pouvez ajuster la configuration une fois que vous avez étudié les résultats d'apprentissage.
Il se peut que certaines colonnes de votre ensemble de données ne puissent pas être sélectionnées comme cible pour votre expérimentation, ou qu'un traitement spécifique leur soit appliqué. Pour des explications sur les caractéristiques courantes détectées dans les données d'apprentissage, voir Configuration d'expérimentations.
Sélection de colonnes de caractéristiques
Une fois la cible définie, vous pouvez sélectionner parmi les autres colonnes disponibles celles à inclure dans l'apprentissage du modèle. Excluez toutes les caractéristiques que vous ne souhaitez pas inclure dans le modèle. Notez que la colonne restera dans l'ensemble de données, mais qu'elle ne sera pas utilisée par l'algorithme d'apprentissage.
Tout en haut du volet Configuration de l'expérimentation, vous pouvez voir le nombre de cellules de votre ensemble de données. Si le nombre dépasse la limite de votre ensemble de données, vous pouvez exclure des caractéristiques pour que ce nombre soit inférieur à la limite.
Vous pouvez sélectionner les colonnes de caractéristiques de différentes manières :
-
Décochez manuellement les cases des caractéristiques que vous souhaitez exclure.
-
Cliquez sur Exclure toutes les caractéristiques et sélectionnez uniquement celles à inclure.
-
Lancez une recherche et excluez ou incluez toutes les caractéristiques du résultat de recherche filtré.
-
Après avoir exécuté la première version de l'expérimentation, vous pouvez définir le Nombre de principales caractéristiques à inclure.
Section Caractéristiques de Configuration de l'expérimentation

Il se peut que certaines colonnes de votre ensemble de données ne puissent pas être sélectionnées comme caractéristiques pour votre expérimentation, ou qu'un traitement spécifique leur soit appliqué. Pour des explications sur les caractéristiques courantes détectées dans les données d'apprentissage, voir Configuration d'expérimentations.
Sélection d'algorithmes
Tous les algorithmes disponibles sont inclus par défaut et vous pouvez exclure tous ceux que vous ne souhaitez pas utiliser. Vous le faites normalement dans le cadre de l'affinement du modèle, une fois que vous avez vu les premiers résultats d'apprentissage. En savoir plus à la section Affinement des modèles.
Section Algorithmes de Configuration de l'expérimentation

Modification des types de données des caractéristiques
Lors du chargement d'un ensemble de données, les colonnes sont traitées comme des colonnes catégoriques ou numériques en fonction du type des données. Dans certains cas, vous pouvez souhaiter modifier ce réglage.
Par exemple, si les jours de la semaine sont représentés par les chiffres 1 à 7, chaque chiffre représente une valeur catégorique. Par défaut, ces chiffres sont traités comme des valeurs numériques classées continues. Par conséquent, vous devez manuellement modifier la configuration pour qu'ils soient traités comme des valeurs catégoriques.
Procédez comme suit :
-
Dans la colonne Type de caractéristique, cliquez sur
.
-
Sélectionnez une valeur dans la liste.
Vous pouvez voir toutes les colonnes dont le type de caractéristique a été modifié dans le volet Configuration de l'expérimentation sous Traitement des données.
Modification de l'ensemble de données
Avant d'exécuter le premier apprentissage de votre expérimentation, vous avez la possibilité de modifier l'ensemble de données. Ensuite, si vous souhaitez utiliser un ensemble de données différent, vous devrez créer une nouvelle expérimentation. Notez que, si vous modifiez l'ensemble de données, vous perdrez toute les configurations que vous avez effectuées.
Procédez comme suit :
-
Dans le volet Configuration de l'expérimentation sous Données d'apprentissage, cliquez sur Modifier l'ensemble de données.
-
Sélectionnez un nouvel ensemble de données.
Configuration de l'optimisation des hyperparamètres
Vous pouvez optimiser le modèle à l'aide de l'optimisation des hyperparamètres. Notez qu'il s'agit d'une option avancée susceptible d'augmenter considérablement la durée d'apprentissage. Pour plus d'informations, voir Optimisation des hyperparamètres.
Section Optimisation du modèle de Configuration de l'expérimentation

Procédez comme suit :
-
Dans le volet Configuration de l'expérimentation, développez la section Optimisation du modèle.
-
Cochez la case Optimisation des hyperparamètres.
-
Vous pouvez éventuellement définir une limite temporelle pour votre optimisation. La limite temporelle par défaut est d'une heure.
Informations courantes trouvées dans les données d'apprentissage
Suivant la qualité de votre ensemble de données, la manière dont vous pouvez utiliser des parties spécifiques des données dans la configuration de votre expérimentation peut être limitée. La colonne Informations de la vue Schéma permet d'identifier les caractéristiques particulières des champs de données et la manière dont elles seront traitées par les algorithmes d'apprentissage machine.
Le tableau suivant indique les informations possibles susceptibles d'apparaître dans le schéma :
Information | Signification | Impact sur la configuration |
---|---|---|
Constante | La colonne contient la même valeur pour toutes les lignes. | La colonne ne peut pas être utilisée comme cible ni comme caractéristique incluse. |
Encodage one-hot | Le type de caractéristique est catégorique et la colonne comporte moins de 14 valeurs uniques. | Aucun effet sur la configuration. |
Impact encoding | Le type de caractéristique est catégorique et la colonne comporte au moins 14 valeurs uniques. | Aucun effet sur la configuration. |
Cardinalité élevée | La colonne comporte un trop grand nombre de valeurs uniques et peut affecter négativement les performances du modèle si elle est utilisée comme caractéristique. | La colonne ne peut pas être utilisée comme cible. |
Données clairsemées | La colonne comporte un trop grand nombre de valeurs nulles. | La colonne ne peut pas être utilisée comme cible ni comme caractéristique incluse. |
Classe sous-représentée | La colonne a une classe de moins de 10 lignes. | La colonne ne peut pas être utilisée comme cible, mais elle peut être incluse comme caractéristique. |