Trabajar con la previsión de series temporales multivariantes
Con Qlik Predict, puede entrenar modelos de aprendizaje automático para pronosticar métricas específicas de tiempo. Mediante métodos basados en redes neuronales, los modelos aprenden y predicen patrones complejos que involucran asociaciones específicas del tiempo, datos objetivo agrupados, características históricas y variables futuras conocidas. Para crear una previsión de series temporales, prepare un conjunto de datos de entrenamiento, utilícelo en un experimento de series temporales, implemente un modelo y, a continuación, cree conjuntos de datos de aplicación que pueda utilizar para generar predicciones.
Componentes de un problema de series temporales
Con la previsión de series temporales, el objetivo es predecir valores objetivo para fechas específicas en el futuro. Por ejemplo, es posible que desee predecir las ventas para la próxima semana, mes o trimestre.
Al desarrollar su problema de series temporales, defina los siguientes componentes:
-
Objetivo y grupos
-
Índice de fecha
-
Horizonte de previsión
-
Covariables
Ilustración simplificada que describe los componentes de un problema de previsión de series temporales en Qlik Predict.

Objetivo
Al igual que con otros tipos de experimentos, el objetivo es la columna para la que deseamos que el modelo prediga valores futuros. Para experimentos de series temporales, el objetivo debe contener datos numéricos, por ejemplo, ventas o inventario.
Si está utilizando grupos en la previsión de series temporales, los modelos predecirán un valor objetivo por grupo y por intervalo de tiempo en la ventana de previsión. Si no está utilizando grupos, sus modelos entrenados predecirán un valor objetivo para cada intervalo de tiempo en la ventana de previsión.
Índice de fecha
El índice de fecha rastrea las métricas de series temporales en un intervalo de tiempo continuo (intervalo de tiempo). Debe decidir su intervalo de tiempo en una etapa temprana: ¿con qué frecuencia necesita predecir valores futuros?
Específicamente, el índice de fecha es una columna que aparece en sus conjuntos de datos de entrenamiento y aplicación para problemas de series temporales. El índice de fecha determina la estructura de ambos conjuntos de datos de aplicación —cada fila representa un intervalo o paso en el tiempo (o, con grupos, un avance en el tiempo para cada agrupación única).
Cuando añade su conjunto de datos de entrenamiento en un experimento de series temporales, las posibles columnas de índice de fecha se identifican automáticamente y se le presentan como Información a nivel de columna. Puede identificarlos a partir del dato Índice de fecha posible en la vista de esquema.
Grupos
Los grupos son características que contienen información categórica para las que desea generar predicciones por separado. Ejemplos clásicos de grupos incluyen el número de tienda o establecimiento y el producto, que podrían haberse utilizado para organizar datos para un objetivo como las ventas. Al seleccionar el número de tienda y el tipo de producto como grupos, sus modelos de series temporales proporcionarán predicciones para cada valor individual en estas columnas. Por ejemplo, con un objetivo de ventas, si tiene tres números de tienda — 1, 2 y 3 — y dos tipos de producto — comestibles y productos frescos — su modelo generará predicciones de ventas para cada combinación única de estos valores.
Debería incorporar grupos en su problema de series temporales si tiene los datos y necesita predicciones individuales por categoría. Otra ventaja de los grupos es que los modelos pueden aprender globalmente, comprendiendo mejor los patrones que existen entre las diferentes agrupaciones que defina.
Puede configurar los grupos a utilizar para cada versión del experimento. Si no especifica grupos, pero se identifican grupos en su conjunto de datos de entrenamiento, el entrenamiento utilizará grupos.
Los grupos se identifican por valores duplicados en la columna de índice de fecha; por ejemplo, para una fecha del 14/1/2025, tiene dos registros: uno para la tienda A y el otro para la tienda B.
Cada grupo en un experimento de series temporales —incluido solo el objetivo— se considera una serie temporal aparte dentro de su conjunto de datos. Consulte ¿Qué es una serie temporal o serie de tiempo?.
Horizonte de previsión
El horizonte de previsión especifica hasta qué punto en el futuro desea realizar la previsión. El horizonte de previsión se compone de la ventana de previsión (el número de intervalos de tiempo para los que necesita predicciones) y la brecha de previsión (un número opcional de intervalos de tiempo después de sus datos históricos para los que no desea predicciones).
Usted establece la ventana de previsión y el tamaño de la brecha al configurar una versión del experimento. Estos valores se utilizan tanto durante el entrenamiento del modelo como al generar predicciones a partir de modelos implementados como implementaciones de ML.
La ventana de previsión es el número de intervalos de tiempo para los que desea predecir en el futuro. Por ejemplo, si su intervalo de tiempo es un día y desea prever las ventas para las próximas dos semanas, establecería su ventana de previsión en 14.
La brecha de previsión o brecha de pronóstico es la cantidad de tiempo en el futuro para la cual no necesita o requiere predicciones. Establecer una brecha de previsión es opcional, porque puede que la necesite o no. La brecha de previsión comienza al final de los datos históricos de entrenamiento registrados que ha proporcionado. La ventana de previsión comienza donde termina la brecha de previsión.
Por ejemplo, podría estar buscando predecir ventas futuras, pero solo le interesan las ventas futuras para fechas posteriores a una semana después del final de sus datos de entrada. En este caso, con un intervalo de tiempo de varios días, podría establecer el tamaño de su brecha de previsión en siete intervalos de tiempo.
Su ventana de previsión seleccionada, además de la cantidad de datos de entrenamiento que tenga, limita la distancia en el futuro que puede pronosticar.Para obtener más información, consulte Ventana de previsión máxima.
Covariables
En los problemas de series de tiempo o series temporales, las características a menudo reciben el nombre de covariables. De forma similar a otros problemas de aprendizaje automático, las covariables son las otras variables que sospechamos que influyen en el resultado del objetivo. Cada covariable se representa como una única columna en su conjunto de datos de entrenamiento.
En la previsión de series temporales, existen varios tipos de covariables y presentan algunas distinciones importantes:
-
Covariables estáticas: son columnas que no varían a lo largo de una serie de tiempo. Las covariables estáticas se aplican en experimentos de series temporales donde se utilizan grupos. Por ejemplo, supongamos que tiene unos grupos de Producto y Número de tienda, y existe una característica denominada Descuento predeterminado. Si el Producto A en la Tienda 1 tiene un descuento predeterminado del 10% y el Producto B en la Tienda 2 tiene un descuento predeterminado del 20%, el Descuento predeterminado sería una covariable estática. Es decir, no varía dentro de los datos del grupo en el que aparece.
Las covariables estáticas se detectan automáticamente a partir de las características históricas que incluimos en el experimento. No es necesario que indique qué características son covariables estáticas.
-
Covariables pasadas: son variables dependientes del tiempo que están disponibles solo en los datos históricos y que varían a lo largo de esos datos. Las covariables pasadas se detectan automáticamente a partir de las características históricas que incluya en el experimento. No es necesario indicar explícitamente qué características son covariables pasadas.
-
Covariables futuras: las covariables futuras, también conocidas como características futuras, son variables dependientes del tiempo de las que conoceremos sus valores futuros dentro del horizonte de previsión. Al usar covariables futuras en el entrenamiento, debe indicarlas como características futuras en la configuración de entrenamiento.
Características futuras
Con las características futuras, puede proporcionar datos adicionales a sus modelos sobre información futura que ya conoce o puede esperar razonablemente. En particular, tiene acceso a valores futuros para esta característica que abarcan su horizonte de previsión seleccionado. Al definir características futuras, debe proporcionar datos históricos y futuros.
Por ejemplo, para un modelo que predice métricas que podrían verse influenciadas por futuros descuentos ofrecidos por una tienda, podría incluir los descuentos observados históricamente, así como los descuentos para futuros períodos de tiempo dentro de la ventana de previsión. Otros ejemplos de características futuras podrían ser información meteorológica o de calendario.
Otros conceptos importantes
Esta sección describe conceptos que son relevantes para su problema de series temporales, pero que no se configuran directamente en un experimento o implementación de ML. Estas son propiedades que se definen por sus datos o por otras propiedades que configura para el modelo.
Intervalos de tiempo
El intervalo de tiempo viene definido por su conjunto de datos de entrenamiento y es importante tanto para el entrenamiento como para las predicciones.
En su conjunto de datos de entrenamiento, el intervalo de tiempo es el intervalo en el que se registran los datos de su índice de fecha. Por ejemplo, el intervalo de tiempo puede ser diario, cada hora, cada minuto o cada segundo.
Es importante conocer el intervalo de tiempo utilizado en sus datos de entrenamiento. Otros parámetros del experimento que defina, como la ventana de previsión y el tamaño de la brecha de previsión, seguirán este intervalo de paso de tiempo.
Tras implementar su modelo, los datos de aplicación para los que desea crear predicciones deberán seguir el mismo intervalo de paso de tiempo que el definido en el conjunto de datos de entrenamiento.
Calidad
Cuando selecciona un conjunto de datos de entrenamiento, el sistema infiere el intervalo de tiempo utilizado. Si hay valores que faltan o huecos en el índice de fecha, las columnas como objetivo, grupos y covariables pueden ser interpoladas automáticamente por el sistema. Sin embargo, si sus datos contienen intervalos de tiempo tan inconsistentes que se detectan diferentes intervalos de tiempo, entonces los datos deben corregirse primero. Por ejemplo, si tiene varios meses de datos registrados una vez al día, pero hay una sección en la que los datos se registran consistentemente semanalmente, el conjunto de datos no se puede utilizar porque se detectarán múltiples intervalos de tiempo.
Ventana de aplicación
La ventana de aplicación, o período de retrospectiva, es la porción de los datos de entrenamiento que el algoritmo puede usar para proporcionar las predicciones para su ventana de previsión especificada.
La ventana de aplicación es calculada y establecida por el sistema. Se mide en intervalos de tiempo. La ventana de aplicación se define por lo que usted establece como la ventana de previsión y la brecha de previsión (horizonte de previsión o pronóstico). El tamaño de la ventana de aplicación se muestra en el panel de configuración del experimento y en el Resumen del entrenamiento del modelo, después de ejecutar al menos una versión del experimento. También se muestra en una implementación de ML Esquema del modelo al crear o editar una configuración de predicción por lotes.
La ventana de aplicación se identifica automáticamente a partir de la configuración de su entrenamiento. Para generar predicciones para una ventana de previsión determinada, debe proporcionar los datos históricos que cubran al menos su ventana de aplicación. Esto se proporciona en su conjunto de datos de aplicación. Consulte Preparar un conjunto de datos de aplicación.
Ventana de previsión máxima
La ventana de previsión máxima se estima a medida que configura su experimento de series temporales. Después de haber ejecutado una versión del entrenamiento, la ventana de previsión máxima se confirma con certeza. La ventana de previsión máxima se le muestra como la Previsión máxima estimada o Previsión máxima en Basado en sus datos, cuando abre el Tipo de objetivo y experimento en el panel de configuración del experimento. La ventana de previsión máxima es el número máximo de intervalos de tiempo para los que puede generar previsiones, dada la ventana de previsión elegida, la cantidad de datos históricos que ha proporcionado y el tamaño de muestra mínimo esperado por el sistema. Cuantos más datos históricos proporcione, más lejos en el tiempo podrá predecir. Sin embargo, para generar predicciones fiables, es importante seleccionar una ventana de previsión razonable.
La ventana de previsión máxima puede ser de hasta 180 intervalos de tiempo.
Hora de corte de la previsión
La hora de corte de la previsión es especialmente importante al definir su conjunto de datos de aplicación durante las predicciones. La hora de corte de la previsión es la última fecha de su muestra para la cual tiene un valor objetivo. Esencialmente, las fechas posteriores a esta hora de corte son las fechas para las cuales desea generar predicciones.
¿Qué es una serie temporal o serie de tiempo?
En la previsión de series temporales de Qlik Predict, cada grupo —incluido solo el objetivo— se consideran series temporales separadas dentro del conjunto de datos de entrenamiento. Por ejemplo, supongamos que su conjunto de datos de entrenamiento contiene métricas de ventas. Estas métricas de ventas se definen para cada tienda y tipo de producto. Con las columnas Tienda y Tipo de producto definidas como grupos, hay tres series temporales en el conjunto de datos de entrenamiento.
Preparar un conjunto de datos de entrenamiento
Para las previsiones de series temporales multivariantes, su conjunto de datos de entrenamiento debe contener las siguientes columnas:
-
Índice de fecha
-
Columna objetivo
-
Columnas de grupo (opcional)
-
Columnas de características (opcional—sin características, está entrenando un modelo de previsión univariante)
Ilustraciones que muestran las columnas y los datos necesarios para conjuntos de datos de entrenamiento de series temporales. Se describen escenarios sin grupos, con un grupo y con dos grupos.

Diagrama lineal que describe los componentes necesarios y la línea de tiempo de un conjunto de datos de entrenamiento para un modelo de previsión de series temporales.

Columna índice de fecha
Necesita un índice de fecha que contenga fechas completas o marcas de tiempo. Esta columna es el índice cronológico a lo largo del cual se rastrean las métricas objetivo y de covariables. La columna índice de fecha organiza las mediciones basadas en el tiempo secuencialmente a lo largo de un intervalo de tiempo consistente (el intervalo de tiempo, también denominado "paso" de tiempo).
La columna índice de fecha se organiza de la siguiente manera, dependiendo de si está utilizando grupos o no:
-
Sin grupos: un único registro para cada intervalo de tiempo. Por ejemplo, con una previsión diaria, cada fila representa un único día.
-
Con grupos: una o más entradas duplicadas para cada intervalo o paso de tiempo en función de los grupos utilizados.
Con un conjunto de datos de entrenamiento multivariante, habrá una o más entradas duplicadas para cada intervalo de tiempo en función de los grupos utilizados. Hay flexibilidad en el intervalo de tiempo que utilice; podría, por ejemplo, registrar fechas una o más veces con una frecuencia diaria, semanal o mensual, y así sucesivamente.
Los valores que faltan o se registran de forma inconsistente en esta columna son a veces aceptables, si se pueden interpolar.Sin embargo, los valores de su índice de fecha no pueden contener varios intervalos de tiempo diferentes. Por ejemplo, si se determina que el intervalo es una vez al día, pero en algún momento se identifica un intervalo de dos veces al día, se producirá un error durante el entrenamiento.
Columna objetivo y columnas de grupo
Su conjunto de datos debe tener una columna objetivo que contenga una métrica numérica que desee pronosticar. Un ejemplo común son las ventas.
Si utiliza grupos, debe proporcionar valores objetivo históricos para cada valor posible en los grupos que añada. Por ejemplo, si su objetivo es hacer previsiones de ventas y añade un grupo Número de tienda que contiene datos de la Tienda A y la Tienda B, su conjunto de datos debe incluir dos registros separados para cada intervalo de tiempo: uno con el valor de ventas para la Tienda A y el otro con el valor de ventas para la Tienda B.
Columnas de características
Puede entrenar un modelo de serie temporal sin ninguna covariable. Sin embargo, si incluye covariables, proporcione una columna en el conjunto de datos para cada característica. Los datos de las características deben ser, por lo general, datos registrados históricamente, a menos que esté añadiendo características futuras. Las columnas de características futuras pueden contener datos históricos y futuros. Solo debe incluir datos de características futuras en el conjunto de datos de entrenamiento si está seguro de que los valores futuros de estas columnas se conocerán cuando cree las predicciones.
Lleve un registro de qué características utilizará como características futuras, ya que deberá seleccionarlas como tales en la configuración del entrenamiento.
Volumen de datos
Su conjunto de datos debe contener suficientes registros. El volumen de sus datos históricos influye en la determinación de cuán lejos en el futuro puede predecir. Su ventana de previsión o pronóstico deseada también afecta a la cantidad de datos históricos que necesita.
Por lo general, cuantos más datos históricos se tenga, mejor. Sin embargo, los datos deben ser de buena calidad y capturar las tendencias deseadas. Si los datos proporcionan información irrelevante o contienen imprecisiones, no es útil tenerlos en el modelo. Considere un equilibrio entre optimizar el volumen y mantener la calidad y la relevancia.
Ejemplos
Preparar un conjunto de datos de aplicación
Tras implementar un modelo de series temporales, necesita desarrollar un conjunto de datos de aplicación para el que se realizarán predicciones.
Conjunto de datos de aplicación — Requisitos y validación
Para los modelos de series temporales, el conjunto de datos de aplicación necesita:
-
Columnas y encabezados de columna para todas las columnas incluidas en el conjunto de datos de entrenamiento.
-
El mismo intervalo de tiempo que el conjunto de datos de entrenamiento.
-
Tantos o más registros de datos históricos (por objetivo y grupo) anteriores a la hora de corte de la previsión como el número de registros en la ventana de aplicación para el modelo. Estos deben ser registros completos que contengan la fecha u hora observada históricamente, el objetivo y los valores de la covariable. La ventana de aplicación viene determinada por la ventana de previsión y la brecha de previsión configurados durante el entrenamiento — cuanto más lejos en el futuro necesite predecir, más datos históricos necesitará en su conjunto de datos de aplicación para ejecutar las predicciones.
-
Registros para todos los intervalos de tiempo futuros en su horizonte de previsión. Para estos registros futuros, incluya solo los valores de la columna de índice de fecha, así como cualquier característica futura. Deje los valores de las otras columnas en blanco.
Ilustraciones que muestran las columnas y los datos necesarios para los conjuntos de datos de aplicación utilizados para generar predicciones a partir de modelos de previsión de series temporales. Se describen escenarios sin grupos, con un grupo y con dos grupos.

Diagrama lineal que describe los componentes necesarios y la cronología de un conjunto de datos de aplicación que se utiliza para generar predicciones con un modelo de previsión de series temporales.
