Deriva dei dati | Guida di Qlik Cloud
Vai al contenuto principale Passa a contenuto complementare

Deriva dei dati

Nel tempo, l'accuratezza del modello può diminuire perché i dati in una o più funzionalità cambiano in termini di distribuzione, grandezza e altre proprietà. Poiché il modello originale è stato addestrato con funzionalità che contengono modelli e distribuzioni specifici, le modifiche future a queste distribuzioni influenzeranno la precisione e la qualità delle previsioni.

La deriva dei dati può essere quantificata e calcolata in vari modi. In Qlik Predict, la deriva dei dati viene calcolata con la formula dell'indice di stabilità della popolazione. Vedere Monitoraggio della deriva dei dati nei modelli distribuiti.

Una best practice consiste nel monitorare il modello per rilevare la deriva dei dati confrontando il set di dati di addestramento originale con il set di dati di applicazione più aggiornato su cui si stanno generando le previsioni. Quando la deriva dei dati raggiunge una soglia specifica, riaddestrare il modello o configurare un nuovo modello se il problema di machine learning originale è cambiato in modo sostanziale.

Per ulteriori informazioni sulla valutazione delle prestazioni del modello nel tempo, vedere Valutazione delle prestazioni del modello nel tempo.

Esempio

Supponiamo che un'azienda abbia un insieme di prodotti che si è stabilito essere popolari principalmente tra i consumatori di età pari o superiore a 45 anni. La distribuzione dei valori per una funzionalità Age potrebbe avere il seguente aspetto.

Grafico a barre che mostra le vendite dell'azienda che attraggono maggiormente i consumatori di età superiore ai 45 anni.

Grafico a barre che mostra la distribuzione degli acquisti di prodotti per età prima che l'azienda introducesse un nuovo prodotto. In questo caso, la distribuzione delle frequenze di età mostra vendite che attraggono principalmente adulti di età pari o superiore a 45 anni.

Di recente, l'azienda ha introdotto un nuovo prodotto commercializzato per attrarre anche i consumatori più giovani. Quando il prodotto viene venduto come previsto, si nota una significativa deriva delle funzionalità per la funzionalità Age.

Grafico a barre che mostra le vendite dell'azienda distribuite in modo più uniforme, con le vendite dell'azienda che attraggono in modo più equo i consumatori di tutte le età.

Grafico a barre che mostra la distribuzione degli acquisti di prodotti per età dopo che l'azienda ha introdotto un nuovo prodotto. In questo caso, la distribuzione delle frequenze di età si è spostata da vendite che attraggono principalmente adulti di età pari o superiore a 45 anni verso una popolarità distribuita in modo più equo tra tutte le fasce d'età.

Monitoraggio della deriva dei dati in Qlik Predict

Qlik Predict dispone di strumenti integrati per aiutare a rilevare la deriva dei dati per singola funzionalità all'interno dei modelli distribuiti. Per ulteriori informazioni, vedere Monitoraggio della deriva dei dati nei modelli distribuiti.

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – ti pregiamo di farcelo sapere!