Vai al contenuto principale Passa a contenuto complementare

Deriva dei dati

Nel corso del tempo, l'accuratezza del modello può diminuire perché i dati di una o più funzioni cambiano nella distribuzione, nell'ampiezza e in altre proprietà. Poiché il modello originale è stato addestrato con funzioni che contengono modelli e distribuzioni specifiche, le modifiche future a queste distribuzioni influenzeranno la precisione e la qualità delle previsioni.

La deriva dei dati può essere quantificata e calcolata in diversi modi. In Qlik AutoML, la deriva dei dati viene calcolata tramite la formula dell'indice di stabilità della popolazione. Vedere Monitoraggio della deriva dei dati nei modelli distribuiti.

Una procedura consigliata è monitorare il modello dati per verificare la deriva dei dati, confrontando il training set originale con il set di dati di applicazione più aggiornato utilizzato per generare le previsioni. Quando la deriva dei dati raggiunge una soglia specifica, addestrare nuovamente il modello o configurare un nuovo modello se il problema di machine learning originale è cambiato in modo sostanziale.

Per ulteriori informazioni sulla valutazione delle prestazioni del modello nel tempo, vedere Valutazione delle prestazioni del modello nel tempo.

Esempio

Supponiamo che un'azienda abbia una serie di prodotti che si è dimostrata popolare soprattutto tra i consumatori di 45 anni e oltre. La distribuzione dei valori per la funzione Age (Età), può apparire come segue.

Grafico a barre che mostra le vendite dell'azienda che risultano più popolati tra i consumatori di età superiore ai 45 anni.

Grafico a barre che mostra la distribuzione degli acquisti del prodotto in base all'età prima che l'azienda introducesse un nuovo prodotto.

Di recente, l'azienda ha introdotto un nuovo prodotto che si rivolge anche ai consumatori più giovani. Quando il prodotto si vende come previsto, è visibile una deriva significativa della funzione Age.

Grafico a barre che mostra le vendite dell'azienda distribuite in modo più uniforme, con le vendite dell'azienda che si rivolgono più equamente ai consumatori di tutte le età.

Grafico a barre che mostra la distribuzione degli acquisti del prodotto in base all'età prima che l'azienda introducesse un nuovo prodotto.

Monitoraggio della deriva dei dati in AutoML

AutoML dispone di strumenti integrati per aiutare a rilevare la deriva dei dati in base alle funzioni all'interno dei modelli distribuiti. Per ulteriori informazioni, vedere Monitoraggio della deriva dei dati nei modelli distribuiti.

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – facci sapere come possiamo migliorare!