Accéder au contenu principal Passer au contenu complémentaire

Configuration d'expérimentations

La configuration des expérimentations consiste à sélectionner la cible et les caractéristiques que le modèle utilisera pour prédire la cible. Vous pouvez également configurer un certain nombre de paramètres facultatifs.

Pour vous aider à sélectionner une cible, le jeu de données historique est analysé et des statistiques synthétiques sont affichées à propos de chaque colonne du jeu de données. Plusieurs étapes de prétraitement automatiques sont appliquées au jeu de données pour s'assurer que seules les données appropriées sont incluses. Pour des informations plus détaillées sur le prétraitement des données, voir Préparation et transformation automatiques des données.

Après avoir exécuté la version 1, vous pouvez créer de nouvelles versions d'expérimentation, si nécessaire, pour affiner davantage l'apprentissage du modèle. Pour plus d'informations, consultez Affinement des modèles.

Conditions requises et autorisations

Pour en savoir plus sur les conditions requises de la part des utilisateurs pour pouvoir utiliser des expérimentations ML, voir Utilisation d'expérimentations.

L'interface

Les sections suivantes expliquent comment naviguer dans l'interface d'expérimentation pour configurer votre expérimentation. Pour plus d'informations sur l'interface, consultez Navigation dans l'interface d'expérimentation.

Navigation par onglets

Lorsque vous créez une expérimentation, l'onglet Données s'ouvre. C'est là que vous pouvez configurer la cible et les caractéristiques de l'expérimentation.

Une fois que vous avez exécuté au moins une version d'expérimentation, d'autres onglets deviennent disponibles. Ces autres onglets vous permettent d'analyser les modèles dont vous venez d'effectuer l'apprentissage dans la version. Si vous devez configurer des versions ultérieures avec des sélections de caractéristiques différentes, vous pouvez revenir à l'onglet Données.

Vue Schéma et Vue Données

Dans l'onglet Données, vous pouvez alterner entre les vues suivantes :

  • Schéma Vue Schéma : vue par défaut. Dans cette vue, chaque colonne de votre jeu de données est représentée par une ligne dans le schéma avec des informations et des statistiques.

  • Tableau Vue Données : vue alternative que vous pouvez utiliser pour accéder à davantage d'informations et d'échantillons de données pour chaque colonne.

Vue Schéma dans une expérimentation ML

Vue Schéma dans une expérimentation ML

Vue Données dans une expérimentation ML

Vue Données dans une expérimentation ML

Panneau Configuration de l'expérimentation

Cliquez sur Schéma Afficher la configuration pour ouvrir un panneau dans lequel vous pouvez davantage personnaliser l'apprentissage de l'expérimentation. Le panneau peut être ouvert quel que soit l'onglet dans lequel vous vous trouvez. Ce panneau fournit un certain nombre d'options de configuration supplémentaires.

Avec le panneau Configuration de l'expérimentation, vous pouvez effectuer les opérations suivantes :

  • Sélectionner une cible avant d'effectuer l'apprentissage de la première version

  • Ajouter ou retirer des caractéristiques

  • Configurer une nouvelle version de l'expérimentation

  • Sélectionner pour modifier ou actualiser l'ensemble de données d'apprentissage

  • Ajouter ou retirer des algorithmes

  • Modifier les paramètres d'optimisation du modèle

Panneau Configuration de l'expérimentation

Panneau de personnalisation développé dans une expérimentation ML

Sélection d'une cible

La colonne cible contient les valeurs que vous voulez que le modèle d'apprentissage automatique prédise. Vous pouvez modifier la colonne cible jusqu'au moment où vous démarrez le premier apprentissage. Ensuite, elle sera verrouillée et vous ne pourrez plus la modifier.

  1. Dans la Schéma Vue Schéma ou la Tableau Vue Données, survolez la colonne.

  2. Cliquez sur l'icône Cible qui apparaît.

    La colonne cible est à présent indiquée par l'icône Cible et les autres colonnes disponibles sont automatiquement sélectionnées comme des caractéristiques.

Sélection de la cible dans la Vue Schéma

Colonne du jeu de données avec le symbole de cible.

Sinon, vous pouvez sélectionner la cible dans le panneau Configuration de l'apprentissage.

Lorsque la cible est sélectionnée, vous pouvez commencer à exécuter la première version de l'expérimentation. En savoir plus à la section Formation d'expérimentations. À ce stade, vous pouvez configurer d'autres paramètres, décrits ci-dessous, ou vous pouvez ajuster la configuration une fois que vous avez étudié les résultats d'apprentissage.

Les explications sur la manière dont vos données sont interprétées et traitées sont affichées à mesure de la poursuite de l'apprentissage de l'expérimentation. Pour plus d'informations, consultez Interprétation des informations analytiques d'un jeu de données.

Détermination du type de modèle créé

La colonne que vous sélectionnez comme cible détermine le type de modèle créé par votre expérimentation. Cela, à son tour, joue un rôle dans la détermination des algorithmes utilisés pour former le modèle. Il se peut que certaines colonnes de votre jeu de données ne puissent pas être sélectionnées comme cible pour votre expérimentation, ou qu'un traitement spécifique leur soit appliqué.

Les types de modèle sont les suivants :

  • Modèle de classification binaire

  • Modèle de classification multiclasse

  • Modèle de régression

Le tableau ci-dessous résume les facteurs de votre cible qui déterminent le type de modèle utilisé.

Caractéristiques de la colonne cible qui déterminent le type de modèle
Type de modèleNombre de valeurs distinctes dans la colonneType de caractéristiques requisInformations supplémentaires
Classification binaire2N'importe lequel-
Classification multiclasse3-10N'importe lequelIl n'est pas possible de sélectionner comme cible une colonne avec plus de 10 classes non-numériques distinctes.
RégressionPlus de 10Numérique-

Pour savoir pour quel type de modèles votre expérimentation effectue l'apprentissage, cliquez sur Schéma Afficher la configuration et développez Algorithmes. Le type de modèle est visible dans le titre de la section.

Sélection de colonnes de caractéristiques

Une fois la cible définie, vous pouvez sélectionner parmi les autres colonnes disponibles celles à inclure dans l'apprentissage du modèle. Excluez toutes les caractéristiques que vous ne souhaitez pas inclure dans le modèle. Notez que la colonne restera dans le jeu de données, mais qu'elle ne sera pas utilisée par l'algorithme d'apprentissage.

Tout en haut du volet Configuration de l'expérimentation, vous pouvez voir le nombre de cellules de votre jeu de données. Si le nombre dépasse la limite de votre jeu de données, vous pouvez exclure des caractéristiques pour que ce nombre soit inférieur à la limite.

Vous pouvez sélectionner les colonnes de caractéristiques de différentes manières :

Dans la Vue Schéma et dans la Vue Données

Dans les vues principales, vous pouvez effectuer les opérations suivantes :

  • Désélectionnez Inclure l'ensemble des caractéristiques disponibles et sélectionnez uniquement celles à inclure.

  • Décochez manuellement les cases des caractéristiques que vous souhaitez exclure.

  • Lancez une recherche et excluez ou incluez toutes les caractéristiques du résultat de recherche filtré.

Dans le panneau Personnalisation de l'apprentissage

Si vous développez le panneau Configuration de l'expérimentation, vous pouvez effectuer les opérations suivantes :

  • Décochez manuellement les cases des caractéristiques que vous souhaitez exclure.

  • Après avoir exécuté la première version de l'expérimentation, vous pouvez définir le Nombre de principales caractéristiques à inclure.

Section Caractéristiques du panneau Configuration de l'expérimentation

Section Caractéristiques du panneau de personnalisation de l'apprentissage AutoML

Lorsque vous sélectionnez des caractéristiques, celles-ci se voient automatiquement attribuer un type de caractéristique. Les types de caractéristique possibles sont les suivants :

  • Catégorique

  • Numérique

  • Date

  • Texte libre

Le type de caractéristique est attribué en fonction des données contenues dans la colonne de caractéristique. Si une caractéristique remplit certains critères, elle peut être mise de côté pour servir de base à des caractéristiques auto-conçues. Si vous le souhaitez, vous pouvez décider d'utiliser la caractéristique dans le cadre de l'ingénierie automatique des caractéristiques. Pour des informations détaillées complète sur l'ingénierie automatique des caractéristiques, voir Ingénierie automatique des caractéristiques.

Il se peut que certaines colonnes de votre jeu de données ne puissent pas être sélectionnées comme caractéristiques pour votre expérimentation, ou qu'un traitement spécifique leur soit appliqué. Les explications sur la manière dont vos données sont interprétées et traitées sont affichées lorsque vous naviguez dans l'apprentissage de l'expérimentation. Pour plus d'informations, consultez Interprétation des informations analytiques d'un jeu de données.

Sélection d'algorithmes

Tous les algorithmes disponibles sont inclus par défaut et vous pouvez exclure tous ceux que vous ne souhaitez pas utiliser. Vous le faites normalement dans le cadre de l'affinement du modèle, une fois que vous avez vu les premiers résultats d'apprentissage. En savoir plus à la section Affinement des modèles.

Section Algorithmes du panneau Configuration de l'expérimentation

Section Algorithmes du panneau de personnalisation de l'apprentissage AutoML.

Modification des types de caractéristiques

Lorsqu'un jeu de données est chargé, les colonnes sont traitées comme étant de type catégorique, numérique, date ou texte libre, en fonction du type de données et d'autres caractéristiques. Dans certains cas, vous pouvez souhaiter modifier ce réglage.

Par exemple, si les jours de la semaine sont représentés par les chiffres 1 à 7, chaque chiffre représente une valeur catégorique. Par défaut, ces chiffres sont traités comme des valeurs numériques classées continues. Par conséquent, vous devez manuellement modifier la configuration pour qu'ils soient traités comme des valeurs catégoriques.

Lorsqu'une colonne est identifiée comme contenant des informations de date et d'heure, elle sert de base pour la création de nouvelles caractéristiques auto-conçues générées. Lorsque cela se produit, la colonne d'origine (la caractéristique parente) est traitée comme ayant le type de caractéristique de date. Vous pouvez modifier la caractéristique parente d'un type de caractéristique de date à un type de caractéristique catégorique. Cependant, si vous faites cela, vous ne pourrez plus utiliser ses caractéristiques auto-conçues lors de l'entraînement de l'expérimentation.

  1. Dans Schéma Vue Schéma, recherchez la caractéristique.

  2. Dans la colonne Type de caractéristique de cette caractéristique, cliquez sur .

  3. Sélectionnez une valeur dans la liste.

Sinon, vous pouvez changer de type de caractéristique depuis la Tableau Vue Données. Recherchez la caractéristique, puis cliquez sur à côté du type de caractéristique actif. Sélectionnez une valeur dans la liste.

Vous pouvez voir toutes les colonnes dont le type de caractéristique a été modifié dans le panneau Configuration de l'expérimentation sous Traitement des données.

Modification du jeu de données

Vous pouvez modifier le jeu de données d'apprentissage avant d'exécuter la première version d'expérimentation, ainsi qu'après avoir exécuté toute version.

Si vous modifiez le jeu de données avant d'exécuter la première version, vous perdrez toute configuration effectuée avant de modifier le jeu de données.

  1. Dans le panneau Configuration de l'expérimentation sous Données d'apprentissage, cliquez sur Modifier le jeu de données.

  2. Sélectionnez un nouveau jeu de données.

Pour plus d'informations sur la modification et l'actualisation du jeu de données lors de l'affinement du modèle (après l'exécution d'une version d'expérimentation), consultez Modification et actualisation du jeu de données.

Configuration de l'optimisation de modèle

Il est possible de personnaliser les paramètres suivants pour optimiser les modèles :

  • en activant ou désactivant l'optimisation de modèle intelligente ;

  • en activant ou désactivant l'optimisation des hyperparamètres.

  • Désactivation ou activation de l'apprentissage temporel

Il est possible d'activer ou de désactiver ces options pour chaque version de l'expérimentation que vous exécutez.

Configuration de l'optimisation intelligente

Par défaut, l'expérimentation utilise l'optimisation de modèle intelligente. Grâce à l'optimisation de modèle intelligente, AutoML gère pour vous le processus d'affinement de modèle via l'itération d'une sélection de caractéristiques et l'application de transformations avancées à vos données.

Pour plus d'informations sur l'optimisation intelligente, consultez Optimisation de modèle intelligente.

Vous pouvez désactiver ce paramètre pour affiner manuellement les modèles dont vous effectuez l'apprentissage. Pour exemple, vous pouvez vouloir commencer l'apprentissage de votre modèle avec l'optimisation de modèle intelligente, puis passer à l'affinement manuel pour la v2 pour ajuster davantage la configuration.

  1. Cliquez sur Schéma Afficher la configuration.

  2. Si vous avez déjà exécuté au moins une version de l'expérimentation, cliquez sur Nouvelle version.

  3. Dans le panneau, développez Optimisation du modèle.

  4. Passez de Intelligente à Manuelle.

  5. À l'aide du curseur, définissez la durée d'exécution maximale de l'apprentissage.

Configuration de l'optimisation de modèle

Activation de l'optimisation de modèle intelligente sous Optimisation du modèle dans le panneau de personnalisation de l'apprentissage AutoML

Configuration de l'optimisation des hyperparamètres

Vous pouvez optimiser les modèles à l'aide de l'optimisation des hyperparamètres. Notez qu'il s'agit d'une option avancée susceptible d'augmenter considérablement la durée d'apprentissage. L'optimisation des hyperparamètres est disponible si vous désactivez l'optimisation intelligente.

Pour plus d'informations, consultez Optimisation des hyperparamètres.

  1. Cliquez sur Schéma Afficher la configuration.

  2. Si vous avez déjà exécuté au moins une version de l'expérimentation, cliquez sur Nouvelle version.

  3. Dans le panneau, développez Optimisation du modèle.

  4. Passez de Intelligente à Manuelle.

  5. Cochez la case Optimisation des hyperparamètres.

  6. Vous pouvez éventuellement définir une limite temporelle pour votre optimisation. La limite temporelle par défaut est d'une heure.

Configuration de l'optimisation des hyperparamètres

Panneau Personnalisation de l'apprentissage AutoML avec l'optimisation des hyperparamètres activée

Configuration de l'apprentissage temporel

Si vous souhaitez que vos modèles fassent l'objet d'un apprentissage en tenant compte d'une dimension Série chronologique, activez l'apprentissage temporel pour la version d'expérimentation. Pour utiliser cette option, vous devez disposer dans votre jeu de données d'une colonne contenant les informations de série chronologique pertinentes.

Lorsque l'apprentissage temporel est activé, AutoML utilise des processus de validation croisée et d'imputation des valeurs nulles spécialisés pour effectuer l'apprentissage des modèles.

Pour plus d'informations, consultez Création de modèles temporels et Validation croisée basée sur le temps.

  1. Cliquez sur Schéma Afficher la configuration.

  2. Si vous avez déjà exécuté au moins une version de l'expérimentation, cliquez sur Nouvelle version.

  3. Dans le panneau, développez Optimisation du modèle.

  4. Sous Test-train split basé sur le temps, sélectionnez l'Index de date à utiliser pour trier les données.

Configurez l'apprentissage temporel en sélectionnant une colonne des données d'apprentissage à utiliser comme index.

Panneau de personnalisation de l'apprentissage AutoML avec une colonne de dates sélectionnée pour activer l'apprentissage temporel

Affichage d'informations analytiques sur les données d'apprentissage

Dans l'onglet Données de l'expérimentation, vous pouvez afficher des informations analytiques sur le traitement des données d'apprentissage. Ces informations sont disponibles dans la colonne Informations de la Lignes de tableau Vue Schéma. Les informations affichées dépendent de l'exécution ou non d'une version avec les données d'apprentissage actuelles. Les modifications apportées à la colonne Informations peuvent vous aider à identifier la raison pour laquelle certaines caractéristiques ne peuvent pas être utilisées ou ont été automatiquement exclues.

Pour plus d'informations sur la signification de chaque information, consultez Interprétation des informations analytiques d'un jeu de données.

En savoir plus

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !