Lavorare con le funzionalità di data nelle previsioni
Quando si eseguono previsioni da una distribuzione ML addestrata con funzionalità di data ingegnerizzate automaticamente, ci sono requisiti su come specificare date e orari nei dati di applicazione. Questi requisiti e considerazioni sono leggermente diversi a seconda che si stiano eseguendo previsioni batch, previsioni in tempo reale o utilizzando il connettore di analisi Qlik Predict.
Ingegneria automatica delle funzionalità di data
L'ingegneria automatica delle funzionalità è una fase di preparazione dei dati che viene eseguita in un esperimento ML durante l'addestramento del modello. Con questo processo, nuove funzionalità vengono create dal set di dati di training e quindi utilizzate per addestrare il modello. Per le colonne di funzionalità di data, questo processo viene eseguito automaticamente per impostazione predefinita. Gli utenti possono disattivare l'ingegneria delle funzionalità di data. Tuttavia, nella maggior parte dei casi, si consiglia di utilizzare questa funzionalità.
Per ulteriori informazioni, vedere Ingegneria delle funzionalità data.
Requisiti per le previsioni batch
Le funzioni data progettate automaticamente vengono generate quando si utilizza il set di dati di addestramento per creare un modello, che viene distribuito e utilizzato come una distribuzione di ML per realizzare previsioni per i nuovi dati (per previsioni batch, questo è il set di dati di applicazione).
Quando un modello addestrato con le funzioni data progettate automaticamente viene distribuito per realizzare previsioni, il set di dati di applicazione su cui di desidera generare le previsioni non deve includere le funzioni data progettate automaticamente. Qlik Predict genera le funzioni progettate automaticamente per il set di dati di applicazione prima della previsione. Tuttavia, il set di dati di applicazione deve includere la funzioni data padre (da cui sono state derivate le parti della data) e la colonna che si sta utilizzando deve avere il tipo di dati Data, Data/Ora, Timestamp o Ora.
I set di dati di previsione creati da una distribuzione ML, inclusi i set di dati di applicazione e SHAP, includeranno le funzioni data progettate automaticamente.
Requisiti per le previsioni in tempo reale e basate su connettore
Quando si eseguono previsioni in tempo reale e previsioni dal connettore di analisi Qlik Predict, esistono requisiti per le funzioni data nei dati di applicazione che si forniscono a Qlik Predict. Per questi tipi di previsioni, i dati di applicazione sono specificati in un piccolo payload JSON anziché come un set di dati di applicazione. Per le previsioni in tempo reale e basate su connettore, si invia il payload JSON all'endpoint di previsione in tempo reale nell'API di Machine Learning.
Perché gli endpoint di previsione in tempo reale nell'API di machine learning in tempo reale siano in grado di elaborare i campi data e timestamp, il payload JSON inviato all'endpoint deve rispettare i seguenti requisiti:
-
I valori Data e Data/Ora devono essere stringhe formattate secondo gli standard ISO 8601. Esempi:
-
2020-01-14
-
2020-01-14T00:00:00.000Z
-
-
La data padre—la funzionalità da cui sono state derivate le parti della data—deve essere inclusa nella sua interezza. Ad esempio, il modello potrebbe utilizzare solo una funzionalità Anno, ma è comunque necessario fornire la data in formato conforme a ISO 8601.
-
I dati contenuti in ogni colonna devono appartenere allo stesso fuso orario.
I requisiti di cui sopra:
-
Si applicano solo per le funzionalità addestrate con l'ingegneria delle funzionalità di data. Se il tipo di funzionalità viene modificato manualmente nel tipo di funzionalità categorica, questi requisiti non si applicano. Se il tipo di funzionalità è stato modificato in categorico, fornire la colonna, nel formato data in cui è stata originariamente utilizzata per l'addestramento, nei dati di applicazione.
-
Non si applicano ai modelli di serie temporali.
L'API per le previsioni in tempo reale è stata deprecata e sostituita dall'endpoint per le previsioni in tempo reale in API di machine learning. La funzionalità in sé non verrà deprecata. Per le previsioni future in tempo reale, utilizzare l'endpoint per le previsioni in tempo reale in API di machine learning. Per assistenza con la migrazione dall'API per le previsioni in tempo reale a API di machine learning, fare riferimento a la guida alla migrazione sul portale per sviluppatori Qlik Cloud.