Accéder au contenu principal Passer au contenu complémentaire

Utilisation de la projection de série temporelle multivariables

Avec Qlik Predict, vous pouvez effectuer l'apprentissage de modèles d'apprentissage automatique pour projeter des métriques spécifiques au temps. En utilisant des méthodes basées sur les réseaux neuronaux, les modèles apprennent et prédisent des tendances complexes impliquant des associations spécifiques au temps, des données cibles groupées, des caractéristiques historiques et des variables futures connues. Pour créer une projection de série temporelle, préparez un jeu de données d'apprentissage, utilisez-le dans une expérimentation de série temporelle, déployez un modèle, puis créez des jeux de données à appliquer que vous pouvez utiliser pour générer des prédictions.

Composants d'un problème de série temporelle

Avec la projection de série temporelle, l'objectif est de prédire des valeurs cibles pour des dates spécifiques dans le futur. Par exemple, vous pourriez vouloir prédire les ventes de la semaine, du mois ou du trimestre prochain(e).

Lors du développement de votre problème de série temporelle, définissez les composants suivants :

  • Cible et groupes

  • Index de date

  • Horizon de projection

  • Covariables

Note InformationsCe cadre explique comment définir une question d'apprentissage automatique pour des problèmes de projection de série temporelle. Pour définir des questions d'apprentissage automatique pour des problèmes de classification et de régression, consultez Définition de questions d'apprentissage automatique.

Illustration simplifiée décrivant les composants d'un problème de projection de série temporelle dans Qlik Predict.

Cible

Comme pour les autres types d'expérimentation, la cible est la colonne pour laquelle vous souhaitez que le modèle prédise des valeurs futures. Pour les expérimentations de série temporelle, la cible doit contenir des données numériques, par exemple, des ventes ou un inventaire.

Si vous utilisez des groupes dans la projection de série temporelle, les modèles prédiront une valeur cible par groupe et par étape temporelle dans la fenêtre de projection. Si vous n'utilisez pas de groupes, vos modèles formés prédiront une valeur cible par étape temporelle dans la fenêtre de projection.

Index de date

L'index de date suit les métriques de série temporelle sur un intervalle de temps continu (étape temporelle). Vous devez décider de votre étape temporelle à un stade précoce : à quelle fréquence devez-vous prédire des valeurs futures ?

Plus précisément, l'index de date est une colonne qui apparaît dans vos jeux de données d'apprentissage et à appliquer destinés aux problèmes de série temporelle. L'index de date détermine la structure de ces deux jeux de données à appliquer — chaque ligne représente une étape temporelle (ou, avec des groupes, une étape temporelle pour chaque regroupement unique).

Lorsque vous ajoutez votre jeu de données d'apprentissage à une expérimentation de série temporelle, les colonnes d'index de date possibles sont automatiquement identifiées et vous sont présentées sous forme d'Informations analytiques au niveau de la colonne. Vous pouvez les identifier à partir de l'information analytique Indexation possible de dates dans la vue du schéma.

Groupes

Les groupes sont des caractéristiques contenant des informations catégoriques pour lesquelles vous souhaitez générer des prédictions séparément. Les exemples classiques de groupes incluent le numéro de magasin et le produit, qui auraient pu être utilisés pour organiser les données d'une cible telle que les ventes. Si vous sélectionnez le numéro de magasin et le type de produit comme groupes, vos modèles de série temporelle fourniront des prédictions pour chaque valeur individuelle de ces colonnes. Par exemple, avec une cible de ventes, si vous avez trois numéros de magasin — 1, 2 et 3 — et deux types de produits — épicerie et produits frais — votre modèle générera des prédictions de ventes pour chaque combinaison unique de ces valeurs.

Vous devriez incorporer des groupes dans votre problème de série temporelle si vous disposez des données et si vous avez besoin de prédictions individuelles par catégorie. Un autre avantage des groupes réside dans le fait que les modèles peuvent apprendre globalement, en comprenant mieux les tendances qui existent entre les différents regroupements que vous définissez.

Vous pouvez configurer les groupes à utiliser pour chaque version d'expérimentation. Si vous ne spécifiez pas de groupes, mais que des groupes sont identifiés dans votre jeu de données d'apprentissage, l'apprentissage utilisera des groupes.

Les groupes sont identifiés par des valeurs dupliquées dans la colonne d'index de date — par exemple, pour une date du 1/14/2025, vous avez deux enregistrements : l'un pour le magasin A et l'autre pour le magasin B.

Chaque groupe d'une expérimentation de série temporelle — y compris la cible seule — est considéré comme une série temporelle distincte au sein de votre jeu de données. Consultez Qu'est-ce qu'une série temporelle ?.

Horizon de projection

L'horizon de projection spécifie jusqu'où dans le futur vous souhaitez effectuer des projections. L'horizon de projection se compose de la fenêtre de projection (le nombre d'étapes temporelles pour lesquelles vous avez besoin de prédictions) et de l'écart de projection (un nombre facultatif d'étapes temporelles après vos données historiques pour lesquelles vous ne souhaitez pas de prédictions).

Vous définissez la fenêtre de projection et la taille d'écart lors de la configuration d'une version d'expérimentation. Ces valeurs sont utilisées à la fois lors de l'apprentissage du modèle et lors de la génération de prédictions à partir de modèles déployés sous forme de déploiements ML.

La fenêtre de projection est le nombre d'étapes temporelles pour lesquelles vous souhaitez effectuer des prédictions dans le futur. Par exemple, si votre étape temporelle est d'un jour et si vous souhaitez projeter les ventes pour les deux prochaines semaines, vous devez définir votre fenêtre de projection sur 14.

L'écart de projection est la durée dans le futur pour laquelle vous n'avez pas besoin de prédictions. La définition d'un écart de projection est facultative, car vous pouvez en avoir besoin ou non. L'écart de projection commence à la fin des données d'apprentissage historiques enregistrées que vous avez fournies. La fenêtre de projection commence là où l'écart de projection se termine.

Par exemple, vous pourriez chercher à prédire les ventes futures, mais vous n'êtes intéressé que par les ventes futures pour des dates ultérieures à une semaine à la fin de vos données d'entrée. Dans ce cas, avec une étape temporelle en jours, vous pourriez définir la taille de votre écart de projection sur sept étapes temporelles.

La fenêtre de projection que vous sélectionnez, en plus de la quantité de données d'apprentissage dont vous disposez, limite la portée de vos projections dans le futur. Pour plus d'informations, consultez Fenêtre de projection maximale.

Covariables

Dans les problèmes de série temporelle, les caractéristiques sont souvent appelées covariables. De même que dans d'autres problèmes d'apprentissage automatique, les covariables sont les autres variables que vous soupçonnez d'avoir une influence sur le résultat de la cible. Chaque covariable est représentée comme une seule colonne dans votre jeu de données d'apprentissage.

Dans la projection de série temporelle, il existe plusieurs types de covariables et ceux-ci présentent des distinctions importantes :

  • Covariables statiques : colonnes qui ne varient pas au cours d'une série temporelle. Les covariables statiques sont applicables dans les expérimentations de série temporelle dans lesquelles des groupes sont utilisés. Par exemple, supposons que vous ayez des groupes pour Produit et Numéro de magasin et qu'il existe une caractéristique Remise par défaut. Si le Produit A du Magasin 1 a une remise par défaut de 10 % et que le Produit B du Magasin 2 a une remise par défaut de 20 %, la Remise par défaut sera une covariable statique. C'est-à-dire qu'elle ne varie pas au sein des données pour le groupe dans lequel elle apparaît.

    Les covariables statiques sont détectées automatiquement à partir des caractéristiques historiques que vous incluez dans l'expérimentation. Vous n'avez pas besoin d'indiquer quelles caractéristiques sont des covariables statiques.

  • Covariables passées : variables dépendantes du temps qui ne sont disponibles que dans les données historiques et qui varient au sein de ces données. Les covariables passées sont détectées automatiquement à partir des caractéristiques historiques que vous incluez dans l'expérimentation. Vous n'avez pas besoin d'indiquer explicitement quelles caractéristiques sont des covariables passées.

  • Covariables futures : les covariables futures, également appelées caractéristiques futures, sont des variables dépendantes du temps pour lesquelles vous connaîtrez les valeurs futures dans l'horizon de projection. Lorsque vous utilisez des covariables futures lors de l'apprentissage, vous devez les indiquer comme caractéristiques futures dans la configuration de l'apprentissage.

Caractéristiques futures

Avec les caractéristiques futures, vous pouvez fournir des données supplémentaires à vos modèles concernant des informations futures que vous connaissez déjà ou que vous pouvez raisonnablement prévoir. En particulier, vous avez accès aux valeurs futures de cette caractéristique couvrant l'horizon de projection que vous avez sélectionné. Lors de la définition de caractéristiques futures, vous devez fournir des données historiques ainsi que des données futures.

Par exemple, pour un modèle prédisant des métriques qui pourraient être influencées par des remises futures offertes par un magasin, vous pourriez inclure les remises observées historiquement ainsi que les remises des périodes futures dans la fenêtre de projection. D'autres exemples de caractéristiques futures pourraient être des informations météorologiques ou calendaires.

Autres concepts importants

Cette section présente les concepts qui sont pertinents pour votre problème de série temporelle, mais que vous ne configurez pas directement dans une expérimentation ou un déploiement ML. Il s'agit de propriétés qui sont définies par vos données ou par d'autres propriétés que vous configurez pour le modèle.

Étapes temporelles

L'étape temporelle est définie par votre jeu de données d'apprentissage et il est important pour l'apprentissage et les prédictions.

Dans votre jeu de données d'apprentissage, l'étape temporelle est l'intervalle auquel les données de votre index de date sont enregistrées. Par exemple, l'étape temporelle peut être une fois par jour, toutes les heures, toutes les minutes ou toutes les secondes.

Il est important de connaître l'étape temporelle utilisée dans vos données d'apprentissage. D'autres paramètres d'expérimentation que vous définissez, tels que la fenêtre de projection et la taille d'écart de projection, suivront cet intervalle d'étape temporelle.

Une fois votre modèle déployé, les données à appliquer pour lesquelles vous souhaitez créer des prédictions devront suivre la même étape temporelle que celle définie dans le jeu de données d'apprentissage.

Qualité

Lorsque vous sélectionnez un jeu de données d'apprentissage, le système déduit l'étape temporelle utilisée. S'il manque des valeurs ou s'il existe des lacunes dans l'index de date, les colonnes telles que la cible, les groupes et les covariables peuvent être automatiquement interpolées par le système. Cependant, si vos données contiennent des intervalles de temps incohérents au point que des étapes temporelles différentes soient détectées, vous devez commencer par corriger les données. Par exemple, si vous disposez de plusieurs mois de données enregistrées une fois par jour, mais qu'il existe une section dans laquelle les données sont enregistrées de manière cohérente sur une base hebdomadaire, le jeu de données ne peut pas être utilisé, car plusieurs étapes temporelles seront détectées.

Fenêtre à appliquer

La fenêtre à appliquer, ou période de rétrospection, est la partie des données d'apprentissage que l'algorithme peut utiliser pour fournir les prédictions pour la fenêtre de projection que vous avez spécifiée.

La fenêtre à appliquer est calculée et définie par le système. Elle est mesurée en étapes temporelles. La fenêtre à appliquer est définie par ce que vous définissez comme fenêtre de projection et écart de projection (horizon de projection). La taille de la fenêtre à appliquer est affichée dans le panneau de configuration de l'expérimentation et dans le Résumé de l'apprentissage du modèle, après l'exécution d'au moins une version d'expérimentation. Elle est également affichée dans le Schéma de modèle du déploiement ML lors de la création ou de la modification d'une configuration de prédiction par lots.

La fenêtre à appliquer est automatiquement identifiée à partir de votre configuration d'apprentissage. Pour générer des prédictions pour une fenêtre de projection donnée, vous devez fournir les données historiques couvrant au moins votre fenêtre à appliquer. Ces données sont fournies dans votre jeu de données à appliquer. Consultez Préparation d'un jeu de données à appliquer.

Fenêtre de projection maximale

La fenêtre de projection maximale est estimée lorsque vous configurez votre expérimentation de série temporelle. Une fois qu'une version de l'apprentissage a été exécutée, la fenêtre de projection maximale est confirmée avec certitude. La fenêtre de projection maximale vous est affichée sous la forme Projection maximale estimée ou Projection maximale sous Informations basées sur vos données, lorsque vous ouvrez Type de cible et d'expérimentation dans le panneau de configuration de l'expérimentation. La fenêtre de projection maximale est le nombre maximal d'étapes temporelles pour lesquelles vous pouvez générer des projections, compte tenu de la fenêtre de projection que vous avez sélectionnée, de la quantité de données historiques que vous avez fournies et de la taille d'échantillon minimale attendue par le système. Plus vous fournissez de données historiques, plus vous pourrez prédire loin dans le temps. Cependant, pour générer des prédictions fiables, il est important de sélectionner une fenêtre de projection raisonnable.

La fenêtre de projection maximale peut atteindre 180 pas temporels.

Date limite de projection

La date limite de projection est particulièrement importante lors de la définition de votre jeu de données à appliquer lors des prédictions. La date limite de projection est la dernière date de votre échantillon pour laquelle vous disposez d'une valeur cible. En l'essence, les dates après cette date limite sont les dates pour lesquelles vous souhaitez générer des prédictions.

Qu'est-ce qu'une série temporelle ?

Dans une projection de série temporelle Qlik Predict, chaque groupe — y compris la cible seule — est considéré comme une série temporelle distincte au sein de du jeu de données d'apprentissage. Par exemple, supposons que votre jeu de données d'apprentissage contienne des métriques de ventes. Ces métriques de ventes sont définies pour chaque magasin et chaque type de produits. Avec les colonnes Magasin et Type de produits définies comme groupes, il existe trois séries temporelles dans le jeu de données d'apprentissage.

Préparation d'un jeu de données d'apprentissage

Pour les projections de série temporelle multivariables, votre jeu de données d'apprentissage doit contenir les colonnes suivantes :

  • Index de date

  • Colonne cible

  • Colonnes de groupes (facultatif)

  • Colonnes de caractéristiques (facultatif — sans caractéristiques, vous effectuez l'apprentissage d'un modèle de projection monovariable)

Illustrations montrant les colonnes et les données nécessaires pour les jeux de données d'apprentissage de série temporelle. Des scénarios sans groupes, avec un groupe et avec deux groupes sont décrits.

Diagramme linéaire décrivant les composants nécessaires et la chronologie d'un jeu de données d'apprentissage pour un modèle de projection de série temporelle.

Colonne d'index de date

Vous avez besoin d'un index de date contenant des dates complètes ou des horodatages. Cette colonne est l'index chronologique le long duquel la cible et les métriques de covariables sont suivies. La colonne d'index de date organise les mesures basées sur le temps de manière séquentielle le long d'un intervalle de temps cohérent (l'étape temporelle).

La colonne d'index de date est organisée comme suit, selon que vous utilisez ou non des groupes :

  • Pas de groupes : un seul enregistrement par étape temporelle. Par exemple, avec une projection quotidienne, chaque ligne représente un seul jour.

  • Avec des groupes : une ou plusieurs entrées en double par étape temporelle en fonction des groupes utilisés.

Avec un jeu de données d'apprentissage multivariables, il existera une ou plusieurs entrées en double par étape temporelle en fonction des groupes utilisés. L'étape temporelle que vous utilisez offre une certaine flexibilité — vous pourriez, par exemple, enregistrer des dates une ou plusieurs fois par jour, par semaine, par mois, etc.

Les valeurs manquantes ou enregistrées de manière incohérente dans cette colonne sont parfois acceptables, si elles peuvent être interpolées. Cependant, vos valeurs d'index de date ne peuvent pas contenir plusieurs étapes temporelles différentes. Par exemple, si l'intervalle est déterminé comme étant une fois par jour, mais qu'à un certain moment, un intervalle de deux fois par jour est identifié, il se produira une erreur lors de l'apprentissage.

Colonne cible et colonnes de groupes

Votre jeu de données doit contenir une colonne cible comportant une métrique numérique que vous souhaitez projeter. Un exemple courant est celui des ventes.

Si vous utilisez des groupes, vous fournissez des valeurs cibles historiques pour chaque valeur possible dans les groupes que vous ajoutez. Par exemple, si votre cible est Ventes et si vous ajoutez un groupe Numéro de magasin qui contient des données pour le Magasin A et le Magasin B, votre jeu de données doit inclure deux enregistrements distincts pour chaque étape temporelle : l'un avec la valeur des ventes du Magasin A et l'autre avec la valeur des ventes du Magasin B.

Colonnes de caractéristiques

Vous pouvez effectuer l'apprentissage d'un modèle de série temporelle sans aucune covariable. Cependant, si vous incluez des covariables, fournissez une colonne dans le jeu de données pour chaque caractéristique. Les données des caractéristiques doivent généralement être des données enregistrées historiquement, à moins que vous n'ajoutiez des caractéristiques futures. Les colonnes de caractéristiques futures peuvent contenir des données historiques et futures. Vous ne devriez inclure des données de caractéristiques futures dans le jeu de données d'apprentissage que si vous êtes certain que les valeurs futures de ces colonnes seront connues lorsque vous créerez des prédictions.

Ne perdez pas de vue les caractéristiques que vous utiliserez comme caractéristiques futures, car vous devrez les sélectionner comme telles dans la configuration de l'apprentissage.

Volume de données

Votre jeu de données doit contenir suffisamment d'enregistrements. Le volume de vos données historiques joue un rôle pour déterminer jusqu'à quel point dans le futur vous pouvez effectuer des prédictions. La fenêtre de projection que vous sélectionnez influe également sur la quantité de données historiques dont vous avez besoin.

Généralement, il est préférable d'avoir trop de données historiques que de ne pas en avoir suffisamment. Cependant, les données doivent être de bonne qualité et capturer les tendances souhaitées. Si les données fournissent des informations non pertinentes ou contiennent des inexactitudes, il n'est pas utile de les avoir dans le modèle. Visez l'équilibre entre optimisation du volume et maintien de la qualité et de la pertinence.

Exemples

Préparation d'un jeu de données à appliquer

Après avoir déployé un modèle de série temporelle, vous devez développer un jeu de données à appliquer pour lequel des prédictions seront effectuées.

Jeu de données à appliquer — conditions et validation

Pour les modèles de série temporelle, le jeu de données à appliquer doit remplir les conditions suivantes :

  • Colonnes et en-têtes de colonne de toutes les colonnes incluses dans le jeu de données d'apprentissage.

  • Même pas temporel que celui du jeu de données d'apprentissage.

  • Autant ou plus d'enregistrements de données historiques (par cible et par groupe) avant l'heure limite de projection que le nombre d'enregistrements de la fenêtre d'application du modèle. Il doit s'agir d'enregistrements complets contenant la date ou l'horodatage historiquement observé, la cible et les valeurs de covariable. La fenêtre d'application est déterminée par la fenêtre et l'écart de projection configurés lors de l'apprentissage — plus vous devez prédire loin dans le futur, plus vous avez besoin de données historiques dans votre jeu de données d'application pour exécuter des prédictions.

  • Enregistrements de toutes les étapes temporelles futures de votre horizon de projection. Pour ces enregistrements futurs, incluez uniquement les valeurs de la colonne d'index de dates, ainsi que toutes les caractéristiques futures. Laissez les valeurs des autres colonnes vides.

Note ConseilLa plupart des conditions en matière de données historiques de votre jeu de données à appliquer consistent à spécifier des volumes de données minimaux acceptables. Vous pouvez toujours en fournir plus que nécessaire. Lorsque le modèle génère des prédictions, seuls les enregistrements nécessaires pour couvrir la fenêtre à appliquer sont utilisés.

Illustrations présentant les colonnes et les données requises pour des jeux de données à appliquer utilisés pour générer des prédictions à partir de modèles de projection de série temporelle. Des scénarios sans groupes, avec un groupe et avec deux groupes sont décrits.

Diagramme linéaire décrivant les composants nécessaires et la chronologie d'un jeu de données à appliquer utilisé pour générer des prédictions avec un modèle de projection de série temporelle.

Exemples

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.