Vai al contenuto principale Passa a contenuto complementare

Modelli di regressione a punteggio

I modelli di regressione prevedono i risultati come un numero, che indica la migliore stima del modello della variabile target. Vengono generate diverse metriche per valutare i modelli di regressione.

Durante il training dell'esperimento di una regressione, i seguenti grafici vengono generati automaticamente per fornire un'analisi rapida dei modelli generati:

  • Importanza della permutazione: un grafico in cui le funzioni sono visualizzate in ordine, dalla massima influenza (maggiore impatto sulle prestazioni del modello) alla minima influenza (minore impatto sulle prestazioni del modello). Per ulteriori informazioni, vedere Importanza della permutazione.

  • Importanza SHAP: un grafico che rappresenta quanto ogni funzione influenza l'esito previsto. Per ulteriori informazioni, vedere Importanza SHAP nell'addestramento dell'esperimento.

R2

R al quadrato (R2) è una misura unitaria della correlazione delle funzioni con il target. Può essere espresso come: di quanto si avvicinano alla perfezione le previsioni del modello rispetto all'utilizzo del valore medio del target?

R2 varia da infinito negativo a 1. Più si avvicina a 1, più la varianza del valore target può essere spiegata dalle variabili funzioni. In altre parole, più è probabile che siano presenti variabili importanti che porterebbero a previsioni accurate.

I grafici mostrano un esempio di altezza rapportata all'età. L'altezza è più strettamente correlata all'età nel primo grafico, dove l'R2 è pari a 0,97, che nel secondo grafico, dove l'R2 è pari a 0,56.

Due grafici che tracciano l'altezza rispetto all'età con diversi valori di R2

Due grafici con valori R2 diversi.

Si noti che un valore R2 inferiore non significa necessariamente che si tratti di un cattivo modello. L'interpretazione di R2 dipende dal caso d'uso e dai dati. Quando si considera il punteggio del modello di regressione, è importante ricordare che una relazione lineare non è sempre critica. Se la regressione lineare produce scarsi risultati mentre altri algoritmi hanno prestazioni migliori, potrebbe semplicemente significare che i dati non possono essere modellati abbastanza bene da una relazione lineare.

RMSE

L'errore quadratico medio (RMSE) può essere interpretato come la differenza media +/- attesa tra un valore previsto e il valore effettivo. È la deviazione standard dei residui (la differenza tra il valore osservato e il valore previsto per una funzione). L'RMSE viene misurato nella stessa unità del valore target.

Ad esempio, supponiamo che il nostro target sia la previsione del valore del contratto e che l'RMSE sia pari a 1250. Ciò significa che, in media, il valore previsto differisce di +/- 1.250 dollari dal valore effettivo.

MSE

L'errore quadratico medio (MSE) può essere interpretato come la differenza al quadrato +/- tra il valore previsto e il valore effettivo che ci aspetteremmo di vedere in media. Viene misurato nella stessa unità del valore target al quadrato.

Nell'esempio della previsione del valore del contratto, un valore MSE di 1562500 significa che il modello ha un errore di +/- 1.562.500 $2. Si noti che l'unità di misura è il dollaro al quadrato.

MAE

L'errore assoluto medio (MAE) è la media di tutti gli errori assoluti di previsione, dove l'errore di previsione è la differenza tra il valore effettivo e quello previsto. L'uso del valore assoluto degli errori di previsione impedisce che gli errori +/- si annullino a vicenda. Il MAE viene misurato nella stessa unità del valore target.

Ulteriori informazioni

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – facci sapere come possiamo migliorare!