Lavorare con le previsioni di serie temporali multivariate

Con Qlik Predict, è possibile addestrare modelli di machine learning per prevedere metriche specifiche per il tempo. Utilizzando metodi basati su reti neurali, i modelli apprendono e prevedono modelli complessi che coinvolgono associazioni specifiche per il tempo, dati di destinazione raggruppati, funzionalità storiche e variabili future note. Per creare una previsione di serie temporali, preparare un set di dati di addestramento, utilizzarlo in un esperimento di serie temporali, distribuire un modello e quindi creare set di dati di applicazione che è possibile utilizzare per generare previsioni.

Componenti di un problema di serie temporali

Con le previsioni di serie temporali, l'obiettivo è prevedere i valori di destinazione per date specifiche nel futuro. Ad esempio, si potrebbe voler prevedere le vendite per la settimana, il mese o il trimestre successivo.

Quando si sviluppa il problema di serie temporali, definire i seguenti componenti:

Destinazione e gruppi
Indice data
Orizzonte di previsione
Covariate

Questo framework descrive come definire una domanda di machine learning per problemi di previsione di serie temporali. Per definire domande di machine learning per problemi di classificazione e regressione, vedere Definizione delle domande di machine learning.

Fare clic per visualizzare a dimensioni complete — Illustrazione semplificata che delinea i componenti di un problema di previsione di serie temporali in Qlik Predict.

Destinazione

Come per altri tipi di esperimento, la destinazione è la colonna per la quale si desidera che il modello preveda i valori futuri. Per gli esperimenti di serie temporali, la destinazione deve contenere dati numerici, ad esempio vendite o inventario.

Se si utilizzano i gruppi nella previsione di serie temporali, i modelli prevederanno un valore di destinazione per gruppo per fase temporale nella finestra di previsione. Se non si utilizzano i gruppi, i modelli addestrati prevederanno un valore di destinazione per ogni fase temporale nella finestra di previsione.

Indice data

L'indice data tiene traccia delle metriche delle serie temporali su un intervallo di tempo continuo (fase temporale). È necessario decidere la fase temporale in una fase iniziale: con quale frequenza è necessario prevedere i valori futuri?

Nello specifico, l'indice data è una colonna che appare nei set di dati di addestramento e di applicazione per i problemi di serie temporali. L'indice data determina la struttura di entrambi questi set di dati di applicazione: ogni riga rappresenta una fase nel tempo (o, con i gruppi, una fase nel tempo per ogni raggruppamento univoco).

Quando si aggiunge il set di dati di addestramento in un esperimento di serie temporali, le possibili colonne dell'indice data vengono identificate automaticamente e presentate come Approfondimenti a livello di colonna. È possibile identificarle dall'approfondimento Possibile indice data nella vista schema.

Gruppi

I gruppi sono funzionalità contenenti informazioni categoriche per le quali si desidera generare previsioni separatamente. Esempi classici di gruppi includono il numero del negozio e il prodotto, che potrebbero essere stati utilizzati per organizzare i dati per una destinazione come le vendite. Selezionando il numero del negozio e il tipo di prodotto come gruppi, i modelli di serie temporali forniranno previsioni per ogni singolo valore in queste colonne. Ad esempio, con una destinazione di vendite, se si hanno tre numeri di negozio (1, 2 e 3) e due tipi di prodotto (generi alimentari e prodotti agricoli), il modello genererà previsioni di vendita per ogni combinazione univoca di questi valori.

È consigliabile incorporare i gruppi nel problema di serie temporali se si dispone dei dati e si necessita di previsioni individuali per categoria. Un altro vantaggio dei gruppi è che i modelli possono apprendere a livello globale, comprendendo meglio i modelli esistenti tra i diversi raggruppamenti definiti.

È possibile configurare i gruppi da utilizzare per ogni versione dell'esperimento. Se non si specificano i gruppi ma i gruppi vengono identificati nel set di dati di addestramento, l'addestramento utilizzerà i gruppi.

I gruppi sono identificati da valori duplicati nella colonna dell'indice data: ad esempio, per una data del 14/01/2025, si hanno due record: uno per il negozio A e l'altro per il negozio B.

Ogni gruppo in un esperimento di serie temporali, inclusa la sola destinazione, è considerato una serie temporale separata all'interno del set di dati. Vedere Cos'è una serie temporale?.

Gruppi primari e secondari

Per i problemi di serie temporali con due colonne di gruppo, un gruppo è il gruppo primario e l'altro è il gruppo secondario. Per esempi, vedere Preparazione di un set di dati di addestramento, Esempio di set di dati di addestramento — due gruppi e Esempio di set di dati di applicazione — due gruppi.

Il raggruppamento primario definisce serie temporali indipendenti. Ad esempio, ogni negozio diventa la propria serie temporale separata, consentendo al modello di apprendere comportamenti e modelli diversi tra i negozi.

Il raggruppamento secondario viene trattato in modo diverso. Invece di creare serie completamente separate, il sistema ruota tali valori in funzionalità aggiuntive (covariate), consentendo alle sotto-serie correlate di fornire informazioni contestuali l'una all'altra.

In genere non è necessario sapere quale gruppo è il primario e quale il secondario, sebbene sia possibile scegliere facoltativamente un gruppo primario nell'esperimento. Si applicano alcune considerazioni per la previsione con modelli di serie temporali distribuiti: vedere Preparazione di un set di dati di applicazione.

Tutti i gruppi primari dovrebbero condividere gli stessi gruppi secondari. Ad esempio, se i negozi sono gruppi primari e i prodotti sono gruppi secondari, ogni negozio dovrebbe contenere lo stesso set di prodotti. I gruppi secondari mancanti porterebbero a dimensioni di funzionalità incoerenti tra le serie temporali.

Se ci si aspetta che i valori del gruppo secondario non si allineino con i valori del gruppo primario al momento della previsione, un possibile approccio è combinare i valori originali del gruppo primario e secondario in una nuova colonna di raggruppamento e utilizzarla come gruppo primario durante il riaddestramento del modello. In questa configurazione, il modello non dipende più dai gruppi secondari, ma le informazioni correlate tra i gruppi potrebbero essere ridotte.

Orizzonte di previsione

L'orizzonte di previsione specifica quanto nel futuro si desidera prevedere. L'orizzonte di previsione è composto dalla finestra di previsione (il numero di fasi temporali per le quali sono necessarie previsioni) e dal divario di previsione (un numero facoltativo di fasi temporali dopo i dati storici per le quali non si desiderano previsioni).

La finestra di previsione e la dimensione del divario vengono impostate durante la configurazione di una versione dell'esperimento. Questi valori vengono utilizzati sia durante l'addestramento del modello sia durante la generazione di previsioni da modelli distribuiti come distribuzioni ML.

La finestra di previsione è il numero di fasi temporali per le quali si desidera prevedere nel futuro. Ad esempio, se la fase temporale è di un giorno e si desidera prevedere le vendite per le due settimane successive, si imposterà la finestra di previsione su 14.

Il divario di previsione è la quantità di tempo nel futuro per la quale non sono richieste previsioni. L'impostazione di un divario di previsione è facoltativa, poiché potrebbe essere necessaria o meno. Il divario di previsione inizia alla fine dei dati di addestramento storici registrati forniti. La finestra di previsione inizia dove finisce il divario di previsione.

Ad esempio, si potrebbe voler prevedere le vendite future, ma si è interessati solo alle vendite future per date successive a una settimana dopo la fine dei dati di input. In questo caso, con una fase temporale in giorni, si potrebbe impostare la dimensione del divario di previsione su sette fasi temporali.

La finestra di previsione selezionata, oltre alla quantità di dati di addestramento disponibili, limita quanto nel futuro è possibile prevedere. Per ulteriori informazioni, vedere Finestra di previsione massima.

Covariate

Nei problemi di serie temporali, le funzionalità sono spesso chiamate covariate. Similmente ad altri problemi di machine learning, le covariate sono le altre variabili che si sospetta abbiano un'influenza sul risultato della destinazione. Ogni covariata è rappresentata come una singola colonna nel set di dati di addestramento.

Nelle previsioni di serie temporali, esistono diversi tipi di covariate e presentano alcune importanti distinzioni:

Covariate statiche: colonne che non variano nel corso di una serie temporale. Le covariate statiche sono applicabili negli esperimenti di serie temporali in cui vengono utilizzati i gruppi. Ad esempio, supponiamo di avere gruppi per Prodotto e Numero negozio e che esista una funzionalità Sconto predefinito. Se il Prodotto A nel Negozio 1 ha uno sconto predefinito del 10% e il Prodotto B nel Negozio 2 ha uno sconto predefinito del 20%, Sconto predefinito sarebbe una covariata statica. Ovvero, non varia all'interno dei dati per il gruppo in cui appare.

Le covariate statiche vengono rilevate automaticamente dalle funzionalità storiche incluse nell'esperimento. Non è necessario indicare quali funzionalità sono covariate statiche.
Covariate passate: variabili dipendenti dal tempo che sono disponibili solo nei dati storici e che variano in questi dati. Le covariate passate vengono rilevate automaticamente dalle funzionalità storiche incluse nell'esperimento. Non è necessario indicare esplicitamente quali funzionalità sono covariate passate.
Covariate future: le covariate future, note anche come funzionalità future, sono variabili dipendenti dal tempo per le quali si conosceranno i valori futuri all'interno dell'orizzonte di previsione. Quando si utilizzano covariate future nell'addestramento, è necessario indicarle come funzionalità future nella configurazione dell'addestramento.

Funzionalità future

Con le funzionalità future, è possibile fornire dati aggiuntivi ai modelli su informazioni future che si conoscono già o che ci si può ragionevolmente aspettare. In particolare, si ha accesso ai valori futuri per questa funzionalità che coprono l'orizzonte di previsione selezionato. Quando si definiscono le funzionalità future, è necessario fornire dati storici e futuri.

Ad esempio, per un modello che prevede metriche che potrebbero essere influenzate da sconti futuri offerti da un negozio, si potrebbero includere gli sconti osservati storicamente, nonché gli sconti per periodi di tempo futuri all'interno della finestra di previsione. Altri esempi di funzionalità future potrebbero essere informazioni meteorologiche o di calendario.

Altri concetti importanti

Questa sezione delinea i concetti rilevanti per il problema di serie temporali, ma che non si configurano direttamente in un esperimento o in una distribuzione ML. Si tratta di proprietà definite dai dati o da altre proprietà configurate per il modello.

Fasi temporali

La fase temporale è definita dal set di dati di addestramento ed è importante sia per l'addestramento sia per le previsioni.

Nel set di dati di addestramento, la fase temporale è l'intervallo in cui vengono registrati i dati nell'indice data. Ad esempio, la fase temporale può essere giornaliera, ogni ora, ogni minuto o ogni secondo. La fase temporale più piccola rilevata è in millisecondi.

È importante essere consapevoli della fase temporale utilizzata nei dati di addestramento. Altri parametri dell'esperimento definiti, come la finestra di previsione e la dimensione del divario di previsione, seguiranno questo intervallo di fase temporale.

Dopo aver distribuito il modello, i dati di applicazione per i quali si desidera creare previsioni dovranno seguire la stessa fase temporale definita nel set di dati di addestramento.

Qualità

Quando si seleziona un set di dati di addestramento, il sistema deduce la fase temporale utilizzata. Se ci sono valori mancanti o divari nell'indice data, colonne come destinazione, gruppi e covariate possono spesso essere interpolate automaticamente dal sistema. I modelli di divario ricorrenti causati da valori mancanti vengono gestiti automaticamente e non introducono di per sé una nuova fase temporale. Tuttavia, se i dati contengono intervalli di registrazione veramente misti al punto in cui vengono rilevate diverse fasi temporali native, i dati devono essere prima corretti. Ad esempio, se si hanno diversi mesi di dati registrati una volta al giorno, ma c'è una sezione in cui i dati vengono registrati costantemente su base settimanale, il set di dati non può essere utilizzato perché verranno rilevate più fasi temporali.

Finestra di applicazione

La finestra di applicazione, o periodo di look-back, è la porzione dei dati di addestramento che l'algoritmo può utilizzare per fornire le previsioni per la finestra di previsione specificata.

La finestra di applicazione viene calcolata e impostata dal sistema. È misurata in fasi temporali. La finestra di applicazione è definita da ciò che si imposta come finestra di previsione e divario (orizzonte di previsione). La dimensione della finestra di applicazione viene mostrata nel pannello di configurazione dell'esperimento e nel Riepilogo addestramento modello, dopo aver eseguito almeno una versione dell'esperimento. Viene mostrata anche in uno Schema modello di distribuzione ML durante la creazione o la modifica di una configurazione di previsione batch.

La finestra di applicazione viene identificata automaticamente dalla configurazione di addestramento. Per generare previsioni per una determinata finestra di previsione, è necessario fornire i dati storici che coprono almeno la finestra di applicazione. Questo viene fornito nel set di dati di applicazione. Vedere Preparazione di un set di dati di applicazione.

Finestra di previsione massima

La finestra di previsione massima viene stimata durante la configurazione dell'esperimento di serie temporali. Dopo aver eseguito una versione dell'addestramento, la finestra di previsione massima viene confermata con certezza. La finestra di previsione massima viene visualizzata come Previsione massima stimata o Previsione massima in In base ai dati, quando si apre Destinazione e tipo di esperimento nel pannello di configurazione dell'esperimento. La finestra di previsione massima è il numero massimo di fasi temporali per le quali è possibile generare previsioni, data la finestra di previsione scelta, la quantità di dati storici forniti e la dimensione minima del campione prevista dal sistema. Più dati storici si forniscono, più lontano nel tempo si sarà in grado di prevedere. Tuttavia, per generare previsioni affidabili, è importante selezionare una finestra di previsione ragionevole.

La finestra di previsione massima può arrivare fino a 180 fasi temporali.

Tempo di interruzione della previsione

Il tempo di interruzione della previsione è particolarmente importante quando si definisce il set di dati di applicazione durante le previsioni. Il tempo di interruzione della previsione è l'ultima data nel campione per la quale si ha un valore di destinazione. Essenzialmente, le date successive a questo tempo di interruzione sono le date per le quali si desidera generare previsioni.

Cos'è una serie temporale?

Nelle previsioni di serie temporali di Qlik Predict, ogni gruppo, inclusa la sola destinazione, è considerato una serie temporale separata all'interno del set di dati di addestramento. Ad esempio, supponiamo che il set di dati di addestramento contenga metriche di vendita. Queste metriche di vendita sono definite per ogni negozio e tipo di prodotto. Con le colonne Negozio e Tipo di prodotto definite come gruppi, ci sono tre serie temporali nel set di dati di addestramento.

Preparazione di un set di dati di addestramento

Per le previsioni di serie temporali multivariate, il set di dati di addestramento deve contenere le seguenti colonne:

Indice data
Colonna di destinazione
Colonne di gruppo (facoltative)
Colonne di funzionalità (facoltative: senza funzionalità, si sta addestrando un modello di previsione univariato)

Colonna indice data

È necessario un indice data contenente date complete o timestamp. Questa colonna è l'indice cronologico lungo il quale vengono tracciate le metriche di destinazione e covariate. La colonna dell'indice data organizza le misurazioni basate sul tempo in modo sequenziale lungo un intervallo di tempo coerente (la fase temporale).

La colonna dell'indice data è organizzata come segue, a seconda che si utilizzino o meno i gruppi:

Nessun gruppo: un singolo record per ogni fase temporale. Ad esempio, con una previsione giornaliera, ogni riga rappresenta un singolo giorno.
Con gruppi: una o più voci duplicate per ogni fase temporale a seconda dei gruppi utilizzati.

Con un set di dati di addestramento multivariato, ci saranno una o più voci duplicate per ogni fase temporale a seconda dei gruppi utilizzati. C'è flessibilità nella fase temporale utilizzata: si potrebbero, ad esempio, registrare le date una o più volte su base giornaliera, settimanale o mensile e così via.

I valori mancanti o registrati in modo incoerente in questa colonna sono talvolta accettabili, se possono essere interpolati, e i modelli di divario ricorrenti di valori mancanti vengono gestiti automaticamente. Tuttavia, i valori dell'indice data non possono contenere più fasi temporali native diverse. Ad esempio, se l'intervallo è determinato come una volta al giorno, ma a un certo punto viene identificato un intervallo di due volte al giorno, si verificherà un errore durante l'addestramento.

Colonna di destinazione e colonne di gruppo

Il set di dati deve avere una colonna di destinazione contenente una metrica numerica che si desidera prevedere. Un esempio comune sono le vendite.

Se si utilizzano i gruppi, si forniscono i valori di destinazione storici per ogni possibile valore nei gruppi aggiunti. Ad esempio, se la destinazione è Vendite e si aggiunge un gruppo Numero negozio che contiene dati per il Negozio A e il Negozio B, il set di dati deve includere due record separati per ogni fase temporale: uno con il valore delle vendite per il Negozio A e l'altro con il valore delle vendite per il Negozio B.

Se si hanno due gruppi, assicurarsi che tutti i gruppi primari condividano gli stessi gruppi secondari. Vedere Gruppi primari e secondari.

Colonne di funzionalità

È possibile addestrare un modello di serie temporali senza alcuna covariata. Tuttavia, se si includono covariate, fornire una colonna nel set di dati per ogni funzionalità. I dati delle funzionalità dovrebbero generalmente essere dati registrati storicamente a meno che non si stiano aggiungendo funzionalità future. Le colonne delle funzionalità future possono contenere sia dati storici sia futuri. Si dovrebbero includere i dati delle funzionalità future nel set di dati di addestramento solo se si è sicuri che i valori futuri di queste colonne saranno noti quando si creeranno le previsioni.

Tenere traccia di quali funzionalità si utilizzeranno come funzionalità future, poiché sarà necessario selezionarle come tali nella configurazione dell'addestramento.

Volume dei dati

Il set di dati deve contenere un numero sufficiente di record: il volume dei dati è determinato dall'intervallo di tempo condiviso tra tutti i gruppi. Solo i dati di questo periodo di sovrapposizione vengono utilizzati per addestrare l'esperimento.

Il volume dei dati storici gioca un ruolo nel determinare quanto nel futuro è possibile prevedere. La finestra di previsione desiderata influisce anche sulla quantità di dati storici necessari.

In generale, più dati storici ci sono, meglio è. Tuttavia, i dati devono essere di buona qualità e catturare le tendenze desiderate. Se i dati forniscono informazioni irrilevanti o contengono inesattezze, non è utile averli nel modello. Considerare un equilibrio tra l'ottimizzazione del volume e il mantenimento della qualità e della pertinenza.

Esempi

La tabella seguente è un esempio troncato di un set di dati di addestramento che non utilizza alcun gruppo.

In questo esempio:

Vogliamo prevedere due settimane di vendite giornaliere, senza alcun divario. Si noti che questo orizzonte di previsione e la dimensione del divario desiderati non sono indicati direttamente nei dati di addestramento, ma forniamo abbastanza record in modo che questo orizzonte di previsione possa essere utilizzato nella configurazione.
Date è l'indice data, con una fase temporale di 1 giorno.
Sales è la destinazione, che tiene traccia delle vendite giornaliere totali.
Transactions Per Hour tiene traccia del numero medio arrotondato di transazioni avvenute all'ora. Questa è una covariata passata, contenente solo dati storici. Queste informazioni non saranno note nel futuro.
On Promotion tiene traccia di quanti prodotti sono scontati a tariffe promozionali per la data specificata. Può essere utilizzata come funzionalità futura, perché in questo caso gli sconti sono noti e pianificati in anticipo. In questo caso, forniamo solo dati storici (passati).

Esempio troncato di set di dati di addestramento che non contiene colonne di gruppo
ID	Date	On Promotion	Transactions per Hour	Sales
1	1/1/2024	0	301	90010.01
2	1/2/2024	100	291	19491.65
3	1/3/2024	0	163	70001.87
4	1/4/2024	14	499	50240.33
5	1/5/2024	55	211	106943.00
6	1/6/2024	2	309	131492.59
7	1/7/2024	1341	300	46349.49
8	1/8/2024	0	432	88203.08
9	1/9/2024	0	104	40254.95
10	1/10/2024	150	495	45964.44
11	1/11/2024	65	204	90185.50
12	1/12/2024	12	252	76340.25
13	1/13/2024	70	99	71311.11
14	1/14/2024	5	305	50396.70
...	...	...	...	...
610	9/1/2025	158	168	104205.33

La tabella seguente è un esempio troncato di un set di dati di addestramento che utilizza due colonne di gruppo.

In questo esempio:

Vogliamo prevedere due settimane di vendite giornaliere, senza alcun divario. Si noti che questa dimensione dell'orizzonte di previsione desiderata non è indicata direttamente nei dati di addestramento, ma forniamo abbastanza record in modo che questo orizzonte di previsione possa essere utilizzato nella configurazione.
Date è l'indice data, con una fase temporale di 1 giorno.
Sales è la destinazione, che tiene traccia delle vendite giornaliere totali.
Store e Product sono gruppi. Per ogni fase temporale univoca nei dati di addestramento, sono incluse righe separate per ogni negozio e prodotto.

In questo contesto, Store è il gruppo primario e Product è il gruppo secondario.
Transactions Per Hour tiene traccia del numero medio di transazioni che avvengono all'ora, per ogni negozio e prodotto. È una covariata passata, contenente solo dati storici. Queste informazioni non saranno note nel futuro.
On Promotion tiene traccia di quanti prodotti sono scontati a tariffe promozionali per la data specificata, per ogni negozio e prodotto. Può essere utilizzata come funzionalità futura, perché in questo caso gli sconti sono noti e pianificati in anticipo. In questo caso, forniamo solo dati storici (passati).

Esempio troncato di set di dati di addestramento che contiene due gruppi
Date	Store	Product	On Promotion	Transactions per Hour	Sales
1/1/2024	Store 1	A	0	343	90010.01
1/1/2024	Store 2	A	100	545	19491.65
1/1/2024	Store 3	A	0	1004	70001.87
1/1/2024	Store 1	B	14	305	39522.11
1/1/2024	Store 2	B	55	700	91859.30
1/1/2024	Store 3	B	2	94	19583.55
1/1/2024	Store 1	C	1341	267	194863.00
1/1/2024	Store 2	C	0	630	140244.13
1/1/2024	Store 3	C	0	1143	76666.66
1/2/2024	Store 1	A	56	576	30593.55
1/2/2024	Store 2	A	3	403	10549.33
1/2/2024	Store 3	A	14	1303	100003.33
1/2/2024	Store 1	B	29	593	105893.99
1/2/2024	Store 2	B	100	305	80195.22
1/2/2024	Store 3	B	0	305	61051.13
1/2/2024	Store 1	C	5	105	55938.38
1/2/2024	Store 2	C	33	72	104823.33
1/2/2024	Store 3	C	15	1052	99105.99
1/3/2024	Store 1	A	5	521	130533.31
1/3/2024	Store 2	A	1	205	67676.73
1/3/2024	Store 3	A	36	302	52745.45
1/3/2024	Store 1	B	111	502	99642.10
1/3/2024	Store 2	B	350	693	34660.34
1/3/2024	Store 3	B	34	200	60345.44
1/3/2024	Store 1	C	93	205	44603.33
1/3/2024	Store 2	C	60	295	105844.44
1/3/2024	Store 3	C	10	76	150385.44
...	...	...	...	...	...
9/10/2025	Store 1	A	15	1058	159383.33
9/10/2025	Store 2	A	20	402	80119.11
9/10/2025	Store 3	A	20	191	106020.00
9/10/2025	Store 1	B	39	100	39581.34
9/10/2025	Store 2	B	109	190	76939.23
9/10/2025	Store 3	B	37	99	49548.42
9/10/2025	Store 1	C	75	1555	93150.77
9/10/2025	Store 2	C	190	1603	15923.49
9/10/2025	Store 3	C	0	403	159342.05

Preparazione di un set di dati di applicazione

Dopo aver distribuito un modello di serie temporali, è necessario sviluppare un set di dati di applicazione per il quale verranno effettuate le previsioni.

Set di dati di applicazione — Requisiti e convalida

Per i modelli di serie temporali, il set di dati di applicazione necessita di:

Colonne e intestazioni di colonna per tutte le colonne incluse nel set di dati di addestramento.
Lo stesso passo temporale del set di dati di addestramento.
Tutti i gruppi e i valori di gruppo che erano presenti nel set di dati di addestramento.

Nota informaticaSe nel set di dati di applicazione sono presenti nuovi valori di gruppo (che non erano presenti nei dati di addestramento), non vengono generate previsioni per queste righe. Se sono necessarie previsioni per questi nuovi valori di gruppo, si consiglia di riaddestrare il modello con dati di addestramento che li includano.
Nota informatica
Al momento della previsione o nel set di dati di applicazione, i valori di gruppo mancanti vengono gestiti come segue:
- L'assenza di valori del gruppo primario, su cui il modello è addestrato, è consentita.
- I valori del gruppo secondario mancanti non sono consentiti. La previsione non riesce e restituisce un errore.
È preferibile raccogliere e fornire tutti i dati del gruppo secondario durante la previsione, quando possibile. Tuttavia, se si prevede che i gruppi secondari manchino principalmente al momento della previsione, una possibile soluzione è evitare del tutto l'uso dei gruppi secondari.

Invece, è possibile combinare i valori originali del gruppo primario e secondario in una singola nuova colonna di raggruppamento, utilizzarla come nuovo gruppo primario e riaddestrare il modello in base a tale struttura. In questa configurazione, il nuovo modello dipende solo dai gruppi primari appena introdotti.

Il compromesso è che si potrebbero perdere alcune delle informazioni correlate tra i gruppi, poiché ora verranno trattati come serie temporali completamente separate piuttosto che come sotto-serie correlate che forniscono informazioni contestuali l'una all'altra.
Un numero di record di dati storici (per target e gruppo) precedente al tempo di interruzione della previsione pari o superiore al numero di record nella finestra di applicazione per il modello. Questi devono essere record completi contenenti la data o la marca temporale osservata storicamente, il target e i valori della covariata. La finestra di applicazione è determinata dalla finestra di previsione e dal divario configurati durante l'addestramento: più a lungo nel futuro è necessario prevedere, più dati storici sono necessari nel set di dati di applicazione per eseguire le previsioni.
Record per tutti i passi temporali futuri nell'orizzonte di previsione. Per questi record futuri, includere solo i valori per la colonna dell'indice della data, nonché eventuali funzionalità future. Lasciare vuoti i valori per le altre colonne.

La maggior parte dei requisiti dei dati storici per il set di dati di applicazione serve a specificare i volumi di dati minimi accettabili. È sempre possibile fornire più dati del necessario. Quando il modello genera previsioni, vengono utilizzati solo i record necessari per coprire la finestra di applicazione.

Esempi

Supponiamo di avere un modello di serie temporali configurato come segue:

Target: Sales
Nessun gruppo
Indice data: Date
Passo temporale: 1 giorno
Finestra di previsione di 7 giorni e intervallo di previsione di 14 giorni. Pertanto, l'orizzonte di previsione è di 21 giorni.
Tempo limite di previsione del 1° settembre 2025. Questa è l'ultima data per la quale sono stati forniti dati storici.
Una covariata passata Transactions Per Hour che tiene traccia del numero medio di transazioni avvenute all'ora.
Una covariata futura On Promotion che tiene traccia di quanti prodotti sono scontati a tariffe promozionali per la data specificata.

In questo esempio, si presuppone che la finestra di applicazione definita dal sistema sia di 63 giorni. Oltre a 63 giorni di dati storici (dal 1° luglio 2025 al 1° settembre 2025), il set di dati fornisce dati di covariate future per l'orizzonte di previsione di 21 giorni (dal 2 al 22 settembre 2025).

Esempio completo di set di dati di applicazione per il modello addestrato senza gruppi
ID	Date	On Promotion	Transactions per Hour	Sales
548	7/1/2025	0	343	90010.01
549	7/2/2025	100	545	19491.65
550	7/3/2025	0	1004	70001.87
551	7/4/2025	14	305	39522.11
552	7/5/2025	55	700	91859.30
553	7/6/2025	2	94	19583.55
554	7/7/2025	1341	267	194863.00
555	7/8/2025	0	630	140244.13
556	7/9/2025	0	1143	76666.66
557	7/10/2025	56	576	30593.55
558	7/11/2025	3	403	10549.33
559	7/12/2025	14	1303	100003.33
560	7/13/2025	29	593	105893.99
561	7/14/2025	100	305	80195.22
562	7/15/2025	0	305	61051.13
563	7/16/2025	5	105	55938.38
564	7/17/2025	33	72	104823.33
565	7/18/2025	15	1052	99105.99
566	7/19/2025	5	521	130533.31
567	7/20/2025	1	205	67676.73
568	7/21/2025	36	302	52745.45
569	7/22/2025	111	502	99642.10
570	7/23/2025	350	693	34660.34
571	7/24/2025	34	200	60345.44
572	7/25/2025	93	205	44603.33
573	7/26/2025	60	295	105844.44
574	7/27/2025	10	76	150385.44
575	7/28/2025	402	473	40963.10
576	7/29/2025	15	1058	159383.33
577	7/30/2025	20	402	80119.11
578	7/31/2025	20	191	106020.00
579	8/1/2025	39	100	39581.34
580	8/2/2025	109	190	76939.23
581	8/3/2025	37	99	49548.42
582	8/4/2025	75	1555	93150.77
583	8/5/2025	190	1603	15923.49
584	8/6/2025	0	403	159342.05
585	8/7/2025	32	430	20451.33
586	8/8/2025	436	1000	150314.44
587	8/9/2025	1	1532	15923.91
588	8/10/2025	40	99	15944.10
589	8/11/2025	42	1058	60000.01
590	8/12/2025	25	734	39583.55
591	8/13/2025	1	569	150333.65
592	8/14/2025	305	692	124594.13
593	8/15/2025	11	164	59303.13
594	8/16/2025	60	205	150333.31
595	8/17/2025	70	186	103483.53
596	8/18/2025	25	1483	105038.13
597	8/19/2025	30	999	201857.11
598	8/20/2025	30	1533	35439.33
599	8/21/2025	30	1583	51956.24
600	8/22/2025	0	350	55334.30
601	8/23/2025	33	1509	11111.12
602	8/24/2025	145	74	15493.33
603	8/25/2025	33	140	159334.14
604	8/26/2025	59	884	45603.39
605	8/27/2025	65	239	46593.34
606	8/28/2025	16	502	74747.74
607	8/29/2025	17	158	45491.34
608	8/30/2025	15	1693	34503.11
609	8/31/2025	36	1544	159334.13
610	9/1/2025	62	1999	193803.15
611	9/2/2025	45	-	-
612	9/3/2025	32	-	-
613	9/4/2025	52	-	-
614	9/5/2025	10	-	-
615	9/6/2025	0	-	-
616	9/7/2025	13	-	-
617	9/8/2025	99	-	-
618	9/9/2025	14	-	-
619	9/10/2025	56	-	-
620	9/11/2025	32	-	-
621	9/12/2025	13	-	-
622	9/13/2025	15	-	-
623	9/14/2025	70	-	-
624	9/15/2025	71	-	-
625	9/16/2025	17	-	-
626	9/17/2025	3	-	-
627	9/18/2025	0	-	-
628	9/19/2025	32	-	-
629	9/20/2025	4	-	-
630	9/21/2025	15	-	-
631	9/22/2025	0	-	-

Supponiamo di avere un modello di serie temporali configurato come segue:

Target: Sales
Indice data: Date
Passo temporale: 1 giorno
Store e Product sono gruppi. In questo contesto, Store è il gruppo primario e Product è il gruppo secondario.
Finestra di previsione di 3 giorni e intervallo di previsione di 1 giorno. Pertanto, l'orizzonte di previsione è di 4 giorni.
Tempo limite di previsione del 1° settembre 2025. Questa è l'ultima data per la quale sono stati forniti dati storici.
Una covariata passata Transactions Per Hour che tiene traccia del numero medio di transazioni che avvengono all'ora, per ogni negozio e prodotto.
Una covariata futura On Promotion che tiene traccia di quanti prodotti sono scontati a tariffe promozionali per la data specificata, per ogni negozio e prodotto.

In questo esempio, si presuppone che la finestra di applicazione definita dal sistema sia di 12 giorni. Oltre a 12 giorni di dati storici (dal 21 agosto al 1° settembre 2025), il set di dati fornisce dati di covariate future per l'orizzonte di previsione di 4 giorni (dal 2 al 5 settembre 2025).

Esempio completo di set di dati di applicazione per il modello addestrato con due gruppi
Date	Store	Product	On Promotion	Transactions per Hour	Sales
8/21/2025	Store 1	A	0	343	90010.01
8/21/2025	Store 2	A	100	545	19491.65
8/21/2025	Store 3	A	0	1004	70001.87
8/21/2025	Store 1	B	14	305	39522.11
8/21/2025	Store 2	B	55	700	91859.30
8/21/2025	Store 3	B	2	94	19583.55
8/21/2025	Store 1	C	1341	267	194863.00
8/21/2025	Store 2	C	0	630	140244.13
8/21/2025	Store 3	C	0	1143	76666.66
8/22/2025	Store 1	A	56	576	30593.55
8/22/2025	Store 2	A	3	403	10549.33
8/22/2025	Store 3	A	14	1303	100003.33
8/22/2025	Store 1	B	29	593	105893.99
8/22/2025	Store 2	B	100	305	80195.22
8/22/2025	Store 3	B	0	305	61051.13
8/22/2025	Store 1	C	5	105	55938.38
8/22/2025	Store 2	C	33	72	104823.33
8/22/2025	Store 3	C	15	1052	99105.99
8/23/2025	Store 1	A	5	521	130533.31
8/23/2025	Store 2	A	1	205	67676.73
8/23/2025	Store 3	A	36	302	52745.45
8/23/2025	Store 1	B	111	502	99642.10
8/23/2025	Store 2	B	350	693	34660.34
8/23/2025	Store 3	B	34	200	60345.44
8/23/2025	Store 1	C	93	205	44603.33
8/23/2025	Store 2	C	60	295	105844.44
8/23/2025	Store 3	C	10	76	150385.44
8/24/2025	Store 1	A	402	473	80195.22
8/24/2025	Store 2	A	15	1058	61051.13
8/24/2025	Store 3	A	20	402	55938.38
8/24/2025	Store 1	B	20	191	104823.33
8/24/2025	Store 2	B	39	100	11111.12
8/24/2025	Store 3	B	109	190	15493.33
8/24/2025	Store 1	C	37	99	159334.14
8/24/2025	Store 2	C	75	1555	45603.39
8/24/2025	Store 3	C	190	1603	19491.65
8/25/2025	Store 1	A	0	403	70001.87
8/25/2025	Store 2	A	32	430	45642.25
8/25/2025	Store 3	A	436	1000	25633.19
8/25/2025	Store 1	B	1	1532	19191.31
8/25/2025	Store 2	B	40	99	90010.01
8/25/2025	Store 3	B	42	1058	19491.65
8/25/2025	Store 1	C	25	734	70001.87
8/25/2025	Store 2	C	1	569	39522.11
8/25/2025	Store 3	C	305	692	91859.30
8/26/2025	Store 1	A	11	164	19583.55
8/26/2025	Store 2	A	60	205	194863.00
8/26/2025	Store 3	A	70	186	140244.13
8/26/2025	Store 1	B	25	1483	76666.66
8/26/2025	Store 2	B	30	999	30593.55
8/26/2025	Store 3	B	30	1533	10549.33
8/26/2025	Store 1	C	30	1583	100003.33
8/26/2025	Store 2	C	0	350	105893.99
8/26/2025	Store 3	C	33	1509	80195.22
8/27/2025	Store 1	A	145	74	61051.13
8/27/2025	Store 2	A	33	140	55938.38
8/27/2025	Store 3	A	59	884	104823.33
8/27/2025	Store 1	B	65	239	99105.99
8/27/2025	Store 2	B	16	502	130533.31
8/27/2025	Store 3	B	17	158	67676.73
8/27/2025	Store 1	C	15	1693	52745.45
8/27/2025	Store 2	C	36	1544	99642.10
8/27/2025	Store 3	C	62	1999	34660.34
8/28/2025	Store 1	A	45	343	60345.44
8/28/2025	Store 2	A	32	545	44603.33
8/28/2025	Store 3	A	52	1004	105844.44
8/28/2025	Store 1	B	10	305	150385.44
8/28/2025	Store 2	B	0	700	40963.10
8/28/2025	Store 3	B	13	94	159383.33
8/28/2025	Store 1	C	99	267	80119.11
8/28/2025	Store 2	C	14	630	106020.00
8/28/2025	Store 3	C	56	1143	39581.34
8/29/2025	Store 1	A	32	576	76939.23
8/29/2025	Store 2	A	13	403	49548.42
8/29/2025	Store 3	A	15	1303	93150.77
8/29/2025	Store 1	B	70	593	15923.49
8/29/2025	Store 2	B	71	305	159342.05
8/29/2025	Store 3	B	17	305	20451.33
8/29/2025	Store 1	C	3	105	150314.44
8/29/2025	Store 2	C	0	72	15923.91
8/29/2025	Store 3	C	32	1052	15944.10
8/30/2025	Store 1	A	4	521	60000.01
8/30/2025	Store 2	A	15	205	39583.55
8/30/2025	Store 3	A	0	302	150333.65
8/30/2025	Store 1	B	15	502	124594.13
8/30/2025	Store 2	B	20	693	59303.13
8/30/2025	Store 3	B	20	200	150333.31
8/30/2025	Store 1	C	39	205	103483.53
8/30/2025	Store 2	C	109	295	105038.13
8/30/2025	Store 3	C	37	76	201857.11
8/31/2025	Store 1	A	75	1058	35439.33
8/31/2025	Store 2	A	190	402	51956.24
8/31/2025	Store 3	A	0	191	55334.30
8/31/2025	Store 1	B	0	100	11111.12
8/31/2025	Store 2	B	100	190	15493.33
8/31/2025	Store 3	B	0	99	159334.14
8/31/2025	Store 1	C	14	1555	45603.39
8/31/2025	Store 2	C	55	1603	46593.34
8/31/2025	Store 3	C	2	403	74747.74
9/1/2025	Store 1	A	1341	158	45491.34
9/1/2025	Store 2	A	0	1693	34503.11
9/1/2025	Store 3	A	0	1544	159334.13
9/1/2025	Store 1	B	56	1999	193803.15
9/1/2025	Store 2	B	3	343	76666.66
9/1/2025	Store 3	B	14	545	30593.55
9/1/2025	Store 1	C	29	303	10549.33
9/1/2025	Store 2	C	100	154	100003.33
9/1/2025	Store 3	C	0	531	34351.42
9/2/2025	Store 1	A	5	-	-
9/2/2025	Store 2	A	33	-	-
9/2/2025	Store 3	A	15	-	-
9/2/2025	Store 1	B	5	-	-
9/2/2025	Store 2	B	1	-	-
9/2/2025	Store 3	B	36	-	-
9/2/2025	Store 1	C	111	-	-
9/2/2025	Store 2	C	350	-	-
9/2/2025	Store 3	C	34	-	-
9/3/2025	Store 1	A	93	-	-
9/3/2025	Store 2	A	60	-	-
9/3/2025	Store 3	A	10	-	-
9/3/2025	Store 1	B	465	-	-
9/3/2025	Store 2	B	22	-	-
9/3/2025	Store 3	B	249	-	-
9/3/2025	Store 1	C	50	-	-
9/3/2025	Store 2	C	15	-	-
9/3/2025	Store 3	C	25	-	-
9/4/2025	Store 1	A	1	-	-
9/4/2025	Store 2	A	0	-	-
9/4/2025	Store 3	A	112	-	-
9/4/2025	Store 1	B	50	-	-
9/4/2025	Store 2	B	75	-	-
9/4/2025	Store 3	B	130	-	-
9/4/2025	Store 1	C	139	-	-
9/4/2025	Store 2	C	136	-	-
9/4/2025	Store 3	C	168	-	-
9/5/2025	Store 1	A	155	-	-
9/5/2025	Store 2	A	73	-	-
9/5/2025	Store 3	A	19	-	-
9/5/2025	Store 1	B	103	-	-
9/5/2025	Store 2	B	54	-	-
9/5/2025	Store 3	B	23	-	-
9/5/2025	Store 1	C	24	-	-
9/5/2025	Store 2	C	134	-	-
9/5/2025	Store 3	C	193	-	-

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – ti pregiamo di farcelo sapere!

Lascia qui il tuo feedback