Ir para conteúdo principal Pular para conteúdo complementar

Correlação

A correlação mede como os recursos em seus dados se relacionam entre si. Os recursos se movem juntos, opostos um ao outro, ou não estão relacionados?

A correlação varia de -1,0 a 1,0. Duas variáveis são consideradas como tendo uma correlação positiva perfeita em 1,0, movendo-se juntas na mesma direção o tempo todo. Variáveis com correlação 0,0 são consideradas não correlacionadas, movendo-se juntas em um padrão aleatório. As variáveis com correlação de -1,0 movem-se juntas, mas em direções opostas.

Um exemplo de recursos positivamente correlacionados é a temperatura e o uso do ar condicionado. Quanto mais alta a temperatura, mais ares condicionados você esperaria usar. Por outro lado, a temperatura e o uso de calor estão negativamente correlacionados. Quanto maior a temperatura, menos calor você espera que seja usado.

Recursos altamente correlacionados provavelmente são redundantes. É uma prática recomendada não incluir dois recursos altamente correlacionados em um modelo.

Correlação não é causalidade

Ao observar fortes correlações - positivas ou negativas - pode ser tentador associá-las à causalidade. Causalidade é quando o movimento em uma variável causa movimento na outra. No entanto, correlação não significa causalidade, e é importante considerar a relação lógica subjacente entre as duas variáveis.

Correlações que não são fundamentadas na lógica são consideradas espúrias. Correlações espúrias são fáceis de descobrir porque não há lógica para unir as duas variáveis. É mais comum perceber a causalidade quando uma variável está ocultando a causa subjacente.

Digamos que estamos tentando entender o que impulsiona as vendas de maiôs em uma rede de lojas de varejo. Encontramos uma relação inesperada entre energia e vendas de maiôs, conforme mostrado no gráfico. Com base nisso, podemos assumir involuntariamente que as vendas de maiôs são impulsionadas pelo consumo de energia per capita.

Consumo de energia versus vendas de maiôs

Gráfico mostrando a correlação entre energia e maiôs vendidos.

Na verdade, o consumo de energia está mascarando outro recurso: a temperatura. À medida que a temperatura aumenta, a demanda por ar condicionado aumenta, o que aumenta o consumo de energia. A energia não está causando demanda de maiôs, mas a temperatura sim.

Temperatura versus vendas de maiôs

Gráfico mostrando a correlação entre temperatura e maiôs vendidos.

Esta página ajudou?

Se você encontrar algum problema com esta página ou seu conteúdo - um erro de digitação, uma etapa ausente ou um erro técnico - informe-nos como podemos melhorar!