Vai al contenuto principale Passa a contenuto complementare

Modelli di regressione a punteggio

I modelli di regressione prevedono i risultati come un numero, che indica la migliore stima del modello della variabile target. Vengono generate diverse metriche per valutare i modelli di regressione.

R2

R al quadrato (R2) è una misura unitaria della correlazione delle funzioni con il target. Può essere espresso come: di quanto si avvicinano alla perfezione le previsioni del modello rispetto all'utilizzo del valore medio del target?

R2 varia da infinito negativo a 1. Più si avvicina a 1, più la varianza del valore target può essere spiegata dalle variabili funzioni. In altre parole, più è probabile che siano presenti variabili importanti che porterebbero a previsioni accurate.

I grafici mostrano un esempio di altezza rapportata all'età. L'altezza è più strettamente correlata all'età nel primo grafico, dove l'R2 è pari a 0,97, che nel secondo grafico, dove l'R2 è pari a 0,56.

Due grafici che tracciano l'altezza rispetto all'età con diversi valori di R2

Due grafici con valori R2 diversi.

Si noti che un valore R2 inferiore non significa necessariamente che si tratti di un cattivo modello. L'interpretazione di R2 dipende dal caso d'uso e dai dati. Quando si considera il punteggio del modello di regressione, è importante ricordare che una relazione lineare non è sempre critica. Se la regressione lineare produce scarsi risultati mentre altri algoritmi hanno prestazioni migliori, potrebbe semplicemente significare che i dati non possono essere modellati abbastanza bene da una relazione lineare.

RMSE

L'errore quadratico medio (RMSE) può essere interpretato come la differenza media +/- attesa tra un valore previsto e il valore effettivo. È la deviazione standard dei residui (la differenza tra il valore osservato e il valore previsto per una funzione). L'RMSE viene misurato nella stessa unità del valore target.

Ad esempio, supponiamo che il nostro target sia la previsione del valore del contratto e che l'RMSE sia pari a 1250. Ciò significa che, in media, il valore previsto differisce di +/- 1.250 dollari dal valore effettivo.

MSE

L'errore quadratico medio (MSE) può essere interpretato come la differenza al quadrato +/- tra il valore previsto e il valore effettivo che ci aspetteremmo di vedere in media. Viene misurato nella stessa unità del valore target al quadrato.

Nell'esempio della previsione del valore del contratto, un valore MSE di 1562500 significa che il modello ha un errore di +/- 1.562.500 $2. Si noti che l'unità di misura è il dollaro al quadrato.

MAE

L'errore assoluto medio (MAE) è la media di tutti gli errori assoluti di previsione, dove l'errore di previsione è la differenza tra il valore effettivo e quello previsto. L'uso del valore assoluto degli errori di previsione impedisce che gli errori +/- si annullino a vicenda. Il MAE viene misurato nella stessa unità del valore target.

Velocità di previsione

La velocità di previsione è una metrica del modello che si applica a tutti i tipi di modello: classificazione binaria, classificazione multiclasse e regressione. La velocità di previsione misura la velocità con cui un modello di apprendimento automatico è in grado di generare previsioni.

In Qlik Predict, la velocità di previsione viene calcolata utilizzando il tempo di calcolo combinato delle funzioni e il tempo di previsione del set di dati di prova. Questa viene visualizzata come righe al secondo.

La velocità di previsione può essere analizzata nella tabella Metriche del modello dopo aver eseguito la versione dell'esperimento. È possibile anche visualizzare i dati sulla velocità di previsione quando si analizzano i modelli con le analisi incorporate. Per ulteriori informazioni, vedere:

Considerazioni

La velocità di previsione misurata si basa sulle dimensioni del training set, piuttosto che sui dati su cui vengono effettuate le previsioni. Dopo aver distribuito un modello, è possibile notare differenze tra la velocità di creazione delle previsioni se i dati di addestramento e di previsione differiscono notevolmente in termini di dimensioni, o quando si creano previsioni in tempo reale su una o poche righe di dati.

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – ti pregiamo di farcelo sapere!