분포도를 사용하여 차원의 측정값 분포 보기

이 예는 Qlik DataMarket의 날씨 데이터를 사용하여 차원의 측정값 분포를 볼 수 있는 분포도를 작성하는 방법을 보여 줍니다.

Distribution plot.

데이터 셋

이 예에서는 Qlik DataMarketWeather for more than 2500 cities worldwide 데이터 소스에서 로드된 날씨 데이터를 사용합니다. 데이터 셋은 Qlik DataMarket의 다음 선택 내용을 기반으로 합니다.

  • Location: Sweden > Gällivare Airport
  • Date: All time
  • Measurement: Average of the 24 hourly temperature observations in degrees Celsius

로드된 데이터 셋에는 2010년부터 2017년까지 스웨덴 북부에 있는 한 기상 관측소의 일일 평균 기온 측정값이 포함됩니다.

측정값

Temperature degrees Celsius라는 이름과 Avg([Average of the 24 hourly temperature observations in degrees Celsius])라는 표현식으로 마스터 항목에 측정값을 작성하여 데이터 셋의 평균 기온 측정을 측정값으로 사용합니다.

시각화

시트에 분포도를 추가하고 다음 데이터 속성을 설정합니다.

  • 차원: Date(날짜) 및 Year(연도). 순서가 중요합니다. Date가 첫 번째 차원이어야 합니다.
  • 측정값: Temperature degrees Celsius. 마스터 항목으로 생성된 측정값입니다.
차원 Date(날짜), Year(연도) 및 측정값 Temperature degrees Celsius가 있는 분포도

Distribution plot.

발견

분포도는 일일 기온 측정의 분포를 시각화합니다. 시각화는 연도별로 정렬되며 각 포인트는 기온 측정값을 나타냅니다.

시각화에서 2012년에 섭씨 -40도에 가까운 가장 낮은 기온 측정이 있음을 알 수 있습니다. 기온 측정 분포가 가장 큰 연도는 2016년인 것으로 보입니다. 분포도에 포인트가 많아 클러스터 및 이상값을 찾아내는 것이 어려울 수 있지만, 2017년에는 두 개의 저온 측정이 두드러집니다. 포인트 위로 마우스 포인터를 이동하면 세부 정보를 볼 수 있습니다.