Correlazione
La correlazione misura il rapporto tra le caratteristiche dei dati. Le caratteristiche si spostano insieme, l'una opposta all'altra, o non sono correlate?
La correlazione varia da -1,0 a 1,0. Si considera che due variabili abbiano una correlazione positiva perfetta a 1,0, spostandosi insieme nella stessa direzione per tutto il tempo. Le variabili con correlazione 0,0 sono considerate non correlate e si spostano in modo casuale. Le variabili con correlazione -1,0 si spostano insieme, ma in direzioni opposte.
Un esempio di correlazione positiva è rappresentato dalla temperatura e dall'uso del condizionatore d'aria. Più alta è la temperatura, più si prevede l'utilizzo di condizionatori d'aria. Al contrario, la temperatura e il consumo di calore sono correlati negativamente. Quanto più alta è la temperatura, tanto minore sarà il calore utilizzato.
Le caratteristiche altamente correlate sono probabilmente ridondanti. È buona norma non includere in un modello due caratteristiche altamente correlate.
La correlazione non è causale
Quando si osservano forti correlazioni, positive o negative, si può essere tentati di associarle alla causalità. La causalità si ha quando lo spostamento di una variabile causa spostamento dell'altra. Tuttavia, correlazione non significa causalità ed è importante considerare la relazione logica sottostante tra le due variabili.
Le correlazioni non fondate sulla logica sono considerate spurie. Le correlazioni spurie sono facili da individuare perché non c'è una logica che lega le due variabili. È più comune percepire la causalità quando una variabile nasconde la causa sottostante.
Diciamo che stiamo cercando di capire cosa guida le vendite di costumi da bagno in una catena di negozi al dettaglio. Come si evince dal grafico, esiste una relazione inaspettata tra l'energia e le vendite di costumi da bagno. Su questa base, potremmo involontariamente supporre che le vendite di costumi da bagno siano influenzate dal consumo energetico pro capite.
In realtà, il consumo energetico nasconde un'altra caratteristica: la temperatura. Con l'aumento della temperatura, la domanda di aria condizionata aumenta, con conseguente incremento del consumo energetico. Non è l'energia a causare la domanda di costumi da bagno, ma la temperatura.