Creazione di dati di previsione
Una volta distribuito e approvato il proprio modello, è possibile creare previsioni su nuovi dati.
Finora abbiamo utilizzato i dati dei clienti esistenti per creare un modello di machine learning. L'obiettivo di questo processo è stato quello di riconoscere i modelli attraverso il machine learning, con l'obiettivo di applicarli a nuovi dati.
Esiste anche un caso d'uso per analizzare solo i valori SHAP nei dati di training. Anche queste informazioni sono molto preziose di per sé.
Per ulteriori informazioni sull'utilizzo delle previsioni in Qlik AutoML, vedere Creazione di previsioni su set di dati.
La prima fase del processo consiste nello scegliere un set di dati a cui applicare il modello per generare previsioni. A questo punto, si configurano le proprietà desiderate per l'output e si generano i file.
Procedere come indicato di seguito:
Nel catalogo, aprire la nuova distribuzione ML.
-
Nell'angolo in basso a destra dell'interfaccia di distribuzione ML, fare clic su Crea previsione.
-
Fare clic su per aprire il pannello Configurazione previsione, se non è già aperto.
-
Quindi, è necessario selezionare il set di dati di applicazione. Sotto Dati di applicazione, fare clic su Seleziona set di dati di applicazione.
-
Selezionare il file del set di dati di applicazione, che sarà uno dei seguenti, a seconda se si utilizza il formato CSV o QVD:
-
AutoML Tutorial - Churn data - apply.csv
-
AutoML Tutorial - Churn data - apply.qvd
-
-
Confrontare gli schemi dei set di dati di training e di quelli di applicazione. Poiché le funzioni sono state deselezionate durante il training, il set di dati di applicazione avrà più campi del training set. Questo non deve generare preoccupazione. Quando si generano previsioni, AutoML semplicemente ignora i campi del set di dati di applicazione che non esistono nel training set.
-
Nel pannello Configurazione previsione, fare clic su Denomina set di dati di previsione. Digitare un nome per il set di dati (o impostarlo sul nome predefinito) e selezionare un formato. Il formato predefinito è Parquet, ma per questo tutorial si utilizzerà il formato CSV.
-
Selezionare uno spazio e fare clic su Conferma.
-
In Opzioni previsione, è possibile configurare i set di dati che si desidera generare con la previsione. In questo caso, confermare che Coordinata SHAP sia l'unica opzione selezionata. Consentire l'uso di AccountID come colonna indice.
Fare clic su Salva e crea previsione ora Il processo può essere monitorato nelle Previsioni del set di dati.
È possibile esaminare l'output nel catalogo facendo clic su Apri nel popup visualizzato.
Una volta terminata l'esecuzione della previsione, è possibile iniziare a costruire un'app utilizzando i nuovi set di dati. Passare all'argomento successivo.