Deriva dei dati
Nel corso del tempo, l'accuratezza del modello può diminuire perché i dati di una o più funzioni cambiano nella distribuzione, nell'ampiezza e in altre proprietà. Poiché il modello originale è stato addestrato con funzioni che contengono modelli e distribuzioni specifiche, le modifiche future a queste distribuzioni influenzeranno la precisione e la qualità delle previsioni.
La deriva dei dati può essere quantificata e calcolata in diversi modi. In Qlik AutoML, la deriva dei dati viene calcolata tramite la formula dell'indice di stabilità della popolazione. Vedere Monitoraggio della deriva dei dati nei modelli distribuiti.
Una procedura consigliata è monitorare il modello dati per verificare la deriva dei dati, confrontando il training set originale con il set di dati di applicazione più aggiornato utilizzato per generare le previsioni. Quando la deriva dei dati raggiunge una soglia specifica, addestrare nuovamente il modello o configurare un nuovo modello se il problema di machine learning originale è cambiato in modo sostanziale.
Per ulteriori informazioni sulla valutazione delle prestazioni del modello nel tempo, vedere Valutazione delle prestazioni del modello nel tempo.
Esempio
Supponiamo che un'azienda abbia una serie di prodotti che si è dimostrata popolare soprattutto tra i consumatori di 45 anni e oltre. La distribuzione dei valori per la funzione Age (Età), può apparire come segue.
Di recente, l'azienda ha introdotto un nuovo prodotto che si rivolge anche ai consumatori più giovani. Quando il prodotto si vende come previsto, è visibile una deriva significativa della funzione Age.
Monitoraggio della deriva dei dati in AutoML
AutoML dispone di strumenti integrati per aiutare a rilevare la deriva dei dati in base alle funzioni all'interno dei modelli distribuiti. Per ulteriori informazioni, vedere Monitoraggio della deriva dei dati nei modelli distribuiti.