Vai al contenuto principale Passa a contenuto complementare

Creazione di modelli sensibili ai valori temporali

Con l'addestramento sensibile ai valori temporali, è possibile creare modelli dati in grado di prevedere i dati in una colonna basata sul tempo presente nei dati di addestramento. Attivare l'addestramento sensibile ai valori temporali se è necessario fare previsioni su una destinazione che è nota per essere influenzata da questa colonna sensibile ai valori temporali.

L'addestramento sensibile ai valori temporali aiuta a ridurre le perdite di dati applicando un'elaborazione specializzata ai dati di addestramento. La pre-elaborazione consente agli algoritmi di machine learning di interpretare meglio i dati e il contesto predittivo come dipendenti da una dimensione specifica per data o ora.

Per addestrare modelli sensibili ai valori temporali, nel training set è necessario che ci sia una colonna che contenga i dati di data e timestamp. Questa colonna è l'indicizzazione della data utilizzata per l'ordinamento del set di dati prima dell'addestramento. Per altre informazioni sull'indicizzazione della data, vedere Requisiti per l'indicizzazione della data.

Casi di utilizzo

L'addestramento di modelli sensibili ai valori temporali è ideale per modelli che prevedono cambiamenti in base a una metrica temporale già presente nell'addestramento. Ad esempio:

  • Si desidera prevedere le vendite del mese successivo e si dispone di una colonna Data transazione nel set di dati.

  • Si desidera prevedere le metriche sulle ultime consegne e si dispone di una colonna Data di consegna nel set di dati.

Considerazioni

A secondo del caso d'uso, l'addestramento di modelli sensibili ai valori temporali può aiutare a creare modelli migliori. In altri casi, si potrebbero ottenere risultati migliori con il processo di addestramento predefinito fornito da AutoML. In generale, se i dati dipendono in modo significativo da una colonna basata sul tempo specifica, si consiglia di utilizzare l'addestramento del modello sensibile ai valori temporale.

In Qlik AutoML, l'addestramento sensibile ai valori temporale non esegue la progettazione automatica delle funzioni per generare funzioni ritardate per i problemi delle serie temporali. Per i casi d'uso basati sul tempo che richiedono la progettazione delle funzioni, si consiglia di eseguire qualsiasi progettazione delle funzioni richiesta durante la fase di preparazione del set di dati.

Come funziona l'addestramento sensibile ai valori temporali

Un problema comune nel machine learning è trovare un modo per assicurarsi che i modelli vengano addestrati solo in base alle informazioni disponibili al momento dell'addestramento. Se i dati di addestramento contengono informazioni importanti relative a data e ora, queste informazioni possono essere utilizzate in modo da prevenire la perdita di dati.

Requisiti per l'indicizzazione della data

Per attivare l'addestramento sensibile ai valori temporali, è necessario che nel set di dati sia presente una colonna contenente le informazioni relative alla data e all'ora da cui dipende l'addestramento del modello. È necessario selezionare la colonna quando si configura l'ottimizzazione del modello per l'addestramento.

Per utilizzare una colonna come indicizzazione della data nell'addestramento, la colonna deve avere le caratteristiche seguenti:

  • Date complete. Ad esempio, non è possibile utilizzare colonne con i valori di mesi o giorni.

  • Il tipo di dati per data o timestamp.

  • Il tipo di funzione per la data.

Controllo e convalida incrociata

Quando si sceglie come separare i dati per il processo di controllo e di convalida incrociata, i metodi di selezione casuale possono introdurre dati futuri nell'elaborazione del modello di addestramento. Quando si attiva l'addestramento sensibile ai valori temporali, AutoML utilizza invece il seguente processo:

  • Il training set viene ordinato in base alla colonna indice selezionata prima di essere separato in dati di addestramento e dati di controllo.

  • Ogni iterazione dell'addestramento utilizza una dimensione fissa per il test e una dimensione che aumenta gradualmente per l'addestramento. Con ogni iterazione, i dati sono sempre più recenti.

Per i dettagli completi, vedere Convalida incrociata basata sul tempo.

Altre elaborazioni

L'addestramento dei modelli sensibili ai valori temporali utilizza anche altri processi differenti dai processi di addestramento predefiniti. Ad esempio, l'addestramento sensibile ai valori temporali utilizza un processo modificato per l'imputazione nulla. Per ulteriori informazioni, vedere Imputazione di valori nulli.

Attivare l'addestramento sensibile ai valori temporali

L'addestramento dei modelli sensibili ai valori temporali può essere attivato o disattivato, o riconfigurato, per ogni versione eseguita in un esperimento.

  1. In un esperimento, fare clic su Schema Visualizza configurazione.

  2. Se si è già eseguita almeno una versione dell'esperimento, fare clic su Nuova versione.

  3. Nel pannello, espandere Ottimizzazione modello.

  4. Nella sezione Suddivisione training-test in base al tempo, selezionare l'Indicizzazione data da utilizzare per l'ordinamento dei dati.

È possibile cambiare l'addestramento sensibile ai valori temporali durante il perfezionamento del modello. Ad esempio, è possibile disattivare l'impostazione o selezionare una nuova colonna come indicizzazione della data. Per ulteriori informazioni, vedere Affinamento dei modelli.

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – facci sapere come possiamo migliorare!