Vai al contenuto principale Passa a contenuto complementare

Creazione e configurazione dell'esperimento di serie temporali

Il primo passo è creare e configurare un esperimento di serie temporali. Si utilizzerà il set di dati di training caricato in precedenza per addestrare il modello fino a quando non sarà pronto per essere distribuito per fare previsioni.

Creazione di un nuovo esperimento

  1. Andare alla pagina Crea nel centro attività Analisi e selezionare Esperimento di ML.

  2. Immettere un nome per l'esperimento, ad esempio, Previsioni di vendita.

  3. Aggiungere facoltativamente una descrizione e dei tag.

  4. Scegliere uno spazio per il proprio esperimento. Può essere uno spazio personale o uno spazio condiviso.

  5. Fare clic su Crea.

  6. Selezionare il file del training set ML - Multivariate forecasting - training.csv.

Esperimento ML con training set di serie temporali selezionato.

Vista schema nel nuovo esperimento ML con set di dati di training di serie temporali selezionato

Configurazione dei parametri di previsione di serie temporali

Passaggio 1: Seleziona destinazione

Inizia definendo una colonna di destinazione. Vogliamo prevedere le vendite future, quindi seleziona quella colonna come destinazione.

  • Nella Righe della tabella vista Schema , fare clic sul pulsante di opzione accanto a sales. Un'icona di destinazione Destinazione sostituisce il pulsante.

Selezione della colonna di destinazione per l'esperimento di serie temporali.

Selezione della colonna di destinazione per l'esperimento di serie temporali

Passaggio 2: Configurare l'esperimento come esperimento di serie temporali

  1. Fare clic su Schema Visualizza configurazione per espandere il pannello di configurazione dell'esperimento, se non è già aperto.

  2. Espandere Destinazione e tipo di esperimento.

  3. In Tipo di esperimento, selezionare Serie temporali. Questa opzione viene visualizzata solo dopo aver selezionato una colonna numerica ad alta cardinalità.

Passaggio 3: Selezionare un indice di data

Successivamente, è necessario selezionare la colonna dell'indice della serie temporale da utilizzare.

  1. Ancora nella sezione Tipo di destinazione ed esperimento del pannello di configurazione, sotto Indice data, fare clic sul menu a discesa per espanderlo.

  2. Selezionare date.

Pannello di configurazione dell'esperimento con Serie temporali selezionato come tipo di esperimento e date selezionato come colonna dell'indice data.

Selezione del tipo di esperimento e dell'indice data per l'esperimento

Dopo aver selezionato l'indice data, alcune nuove informazioni sono apparse nel pannello.Ora puoi configurare Gruppi e Funzionalità future, e regolare le impostazioni di previsione.

Passaggio 4: Seleziona gruppi

Il set di dati di addestramento per questa esercitazione è progettato per la previsione multivariata. Con la previsione multivariata, l'obiettivo è prevedere i valori target insieme ad altre dimensioni che variano direttamente insieme al target. Ad esempio, in questa esercitazione, i dati contengono metriche di vendita monitorate individualmente per ogni negozio e famiglia di prodotti. La previsione multivariata consente di combinare ciascuna di queste dimensioni — che altrimenti dovrebbero essere addestrate come modelli separati — in un unico esperimento, consentendo ai modelli di apprendere di più sui modelli e sulle interazioni tra diverse coorti di dati.

Si configurano esperimenti multivariati selezionando fino a due colonne dai dati di addestramento da utilizzare come gruppi.

L'obiettivo di questa esercitazione è addestrare modelli per apprendere e prevedere le vendite insieme al numero del negozio e alla famiglia di prodotti, quindi selezionare queste due colonne come gruppi.

  • Selezionare store_nbr e family come Gruppi.

Nota informatica Se non viene selezionato esplicitamente alcun gruppo, il modello cercherà automaticamente un raggruppamento adatto utilizzando solo funzionalità categoriche. Una volta identificato un gruppo valido, il processo procede all'addestramento. Pertanto, se vogliamo che il sistema rilevi automaticamente store_nbr come colonna di gruppo valida, deve essere contrassegnata come funzionalità categorica.

Passaggio 5: Configurare le covariate (funzionalità)

I termini "covariata" e "funzionalità" sono spesso usati come sinonimi nell'apprendimento automatico, ma nella previsione di serie temporali in Qlik Predict, il termine "covariata" è comunemente usato e più descrittivo. In un modello di serie temporali multivariato, esistono tre tipi di covariate: statiche, passate e future.

Le covariate statiche e passate sono tra le Funzionalità che includi nell'addestramento dell'esperimento, oltre ai gruppi, all'indice di data e alle funzionalità future. Le covariate statiche e passate vengono identificate automaticamente dal sistema. Non è necessario configurarle oltre a includerle come funzionalità (ed evitando di configurarle come funzionalità future).

Le covariate future, o funzionalità future, si riferiscono anche alle Funzionalità che includi nell'addestramento. Le covariate future sono funzionalità che hanno dati futuri che conoscerai in anticipo—in particolare, hai accesso a valori futuri per questa funzionalità che coprono il tuo orizzonte di previsione selezionato. Per le funzionalità future, è inoltre necessario conoscere i valori dei dati per l'intervallo di tempo storico su cui il modello è addestrato.

Oltre a includere una funzionalità futura nell'elenco delle funzionalità di addestramento, è inoltre necessario configurarla come funzionalità futura nel pannello di configurazione dell'addestramento. Al momento della previsione, il modello si aspetterà dati delle funzionalità future che coprono l'orizzonte di previsione al fine di generare previsioni accurate.

Nei dati di addestramento, la funzionalità onpromotion tiene traccia di quanti prodotti sono scontati a tariffe promozionali per la data specificata. Questa è un'informazione che è nota in anticipo e per la quale sono disponibili dati futuri, quindi può essere utilizzata come funzionalità futura.

  • Sotto il menu a discesa Gruppi, espandi Funzionalità future e seleziona onpromotion.

Per riepilogare:

  • onpromotion è stata selezionata come funzionalità futura.

  • Oltre all'indice data, nessun'altra covariata è stata selezionata per l'addestramento.

Passaggio 6: Imposta la finestra di previsione e l'intervallo

Dopo aver selezionato il tuo indice di data, alcune nuove informazioni appaiono nel pannello.

Vai alla sezione Basato sui tuoi dati.Questa sezione delinea l'intervallo di tempo dei tuoi dati storici e ti consente di configurare l'intervallo di date future per le quali desideri previsioni.

Il Previsione massima stimata è di 180 giorni. Questa stima si basa sui dati storici disponibili, dove la finestra di previsione è una frazione dei dati storici totali disponibili. Rappresenta il numero massimo di passi temporali futuri (in questo caso, giorni) per i quali si stima che tu sia in grado di prevedere il target. Dopo aver eseguito una versione dell'addestramento, saranno note più informazioni e questa stima sarà sostituita da una previsione massima definitiva.

La dimensione della finestra di previsione imposta quanti passi temporali nel futuro si desidera prevedere. Ad esempio, in questa esercitazione, impostare la finestra di previsione su 7 indicherebbe che il modello deve prevedere una settimana di date target future.

La dimensione del gap di previsione imposta il numero di passi temporali immediatamente successivi alla fine dei dati di addestramento per i quali non si desiderano previsioni. Ad esempio, potresti voler prevedere le vendite solo per date tre o più giorni nel futuro.

  1. Nella sezione Basato sui tuoi dati, imposta la Dimensione finestra previsione su 7 passi temporali.

  2. Imposta la Dimensione intervallo previsione su 3 passi temporali.

Nota informaticaL'orizzonte di previsione è la finestra di previsione più la dimensione dell'intervallo di previsione, misurato in passi temporali. In questo caso, l'orizzonte di previsione è 10, il che indica che al momento della previsione, si stanno prevedendo 10 passi temporali in anticipo, anche se nessun valore effettivo potrebbe essere stato registrato per quell'intervallo di previsione.

Pannello di configurazione dell'esperimento che mostra i gruppi configurati, la funzionalità futura e un riepilogo di tutte le funzionalità selezionate.

Pannello di configurazione dell'esperimento che mostra i gruppi configurati, la funzionalità futura e un riepilogo di tutte le funzionalità selezionate.

Il seguente diagramma illustra i concetti di previsione delle serie temporali e come si relazionano alla configurazione dell'esperimento. Per maggiori informazioni sui concetti di previsione delle serie temporali, vedere Utilizzo della previsione di serie temporali multivariate.

Illustrazione semplificata che delinea i componenti di un problema di previsione delle serie temporali in Qlik Predict.

Conferma delle altre impostazioni

Ora che hai completato le configurazioni delle serie temporali, esamina le restanti impostazioni di training nel pannello di configurazione.

  • Sotto Funzionalità, puoi vedere che sono selezionate quattro funzionalità.

  • Sotto Algoritmi, puoi vedere che tutti gli algoritmi disponibili sono selezionati.

Training dell'esperimento

La configurazione è terminata e siamo pronti per iniziare il training.

  • Nell'angolo in basso a destra, fare clic su Esegui esperimento.

Una volta terminata l'esecuzione dell'esperimento, possiamo passare alla fase successiva, che consiste nell'esaminare le metriche del modello risultanti.

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – ti pregiamo di farcelo sapere!