Visualizando a distribuição de valores de medidas em uma dimensão com um gráfico de distribuição
Este exemplo mostra como fazer um gráfico de distribuição para visualizar a distribuição de valores de medidas em uma dimensão, usando dados meteorológicos como exemplo.
Conjunto de dados
Neste exemplo, usaremos os seguintes dados meteorológicos.
- Location: Sweden > Gällivare Airport
- Date range: all data from 2010 to 2017
- Measurement: Average of the 24 hourly temperature observations in degrees Celsius
O conjunto de dados que é carregado contém medições diárias de temperatura média de uma estação meteorológica no norte da Suécia durante o período de 2010 a 2017.
Medida
Usamos a medição de temperatura média do conjunto de dados como a medida, criando uma medida em Itens mestre com o nome Temperature degrees Celsius, e a expressão Avg([Average of the 24 hourly temperature observations in degrees Celsius]).
Visualização
Adicionamos um gráfico de distribuição à pasta e definimos as seguintes propriedades de dados:
- Dimensão: Date (data) e Year (ano). A ordem é importante; Date precisa ser a primeira dimensão.
- Medida: Temperature degrees Celsius, a medida foi criada como item mestre.
Descoberta
O gráfico de distribuição visualiza a distribuição das medições diárias de temperatura. A visualização é organizada por ano, e cada ponto representa uma medição de temperatura.
Em uma visualização, podemos ver que o ano de 2012 tem a medição de temperatura extrema mais baixa, perto de - 40 ºC. Também podemos ver que o ano de 2016 parece ter a maior distribuição de medições de temperatura. Com tantos pontos no gráfico de distribuição, pode ser difícil localizar clusters e discrepâncias, mas o ano de 2017 tem duas medições de temperatura que se destacam. Você pode posicionar o mouse sobre um ponto e visualizar os detalhes.