Przeskocz do zawartości głównej Przejdź do treści uzupełniającej

Korelacja

Korelacja mierzy wzajemne relacje cech w danych. Czy cechy zmieniają się razem, w przeciwnym kierunku, czy też nie są ze sobą powiązane?

Korelacja ma zakres od -1 do 1. Uważa się, że dwie zmienne mają doskonałą dodatnią korelację na poziomie 1 i cały czas zmieniają się razem w tym samym kierunku. Zmienne z korelacją 0 są uważane za nieskorelowane i zmieniają się razem losowo. Zmienne o korelacji -1 zmieniają się razem, ale w przeciwnych kierunkach.

Przykładem dodatnio skorelowanych cech jest temperatura i używanie klimatyzatorów. Im wyższa temperatura, tym więcej klimatyzatorów będzie prawdopodobnie używanych. Z kolei odwrotna korelacja zachodzi między temperaturą a ogrzewaniem. Im wyższa temperatura, tym mniej będzie się prawdopodobnie używać ogrzewania.

Cechy silnie skorelowane są prawdopodobnie zbędne. Najlepszą praktyką jest nieuwzględnianie w modelu dwóch mocno skorelowanych cech.

Korelacja to nie przyczynowość

Obserwacja mocnych korelacji — dodatnich czy ujemnych — może skłaniać do kojarzenia ich z przyczynowością. Przyczynowość występuje, gdy zmiana jednej zmiennej powoduje zmianę drugiej. Korelacja nie oznacza jednak związku przyczynowego i ważne jest, aby uwzględniać podstawowy związek logiczny między obiema zmiennymi.

Korelacje niepoparte logiką są uważane za pozorne. Pozorne korelacje są łatwe do wykrycia, ponieważ nie ma logiki, która łączyłaby ze sobą obie zmienne. Częściej dostrzega się przyczynowość, gdy zmienna maskuje przyczynę zasadniczą.

Załóżmy, że chcemy zrozumieć, co stymuluje sprzedaż strojów kąpielowych w sieci sklepów detalicznych. Znajdujemy nieoczekiwany związek między energią a sprzedażą strojów kąpielowych, jak pokazano na wykresie. Na tej podstawie możemy niechcący założyć, że sprzedaż strojów kąpielowych jest stymulowana przez zużycie energii na mieszkańca.

Zużycie energii a sprzedaż strojów kąpielowych

Wykres przedstawiający korelację między energią a sprzedanymi strojami kąpielowymi.

W rzeczywistości zużycie energii maskuje inną cechę — temperaturę. Wraz ze wzrostem temperatury wzrasta zapotrzebowanie na klimatyzację, co zwiększa zużycie energii. Energia nie powoduje popytu na stroje kąpielowe, ale temperatura tak.

Temperatura a sprzedaż strojów kąpielowych

Wykres przedstawiający korelację między temperaturą a sprzedanymi strojami kąpielowymi.

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać, co możemy poprawić!