기본 콘텐츠로 건너뛰기

상자 그림을 사용하여 숫자 데이터의 범위 및 분포 시각화

이 페이지에서

상자 그림을 사용하여 숫자 데이터의 범위 및 분포 시각화

이 예는 Qlik DataMarket에서 일일 기온 측정값을 사용하여 상자 그림을 만들어 숫자 데이터의 범위 및 분포를 시각화하는 방법을 보여 줍니다.

Box plot visualization.

데이터 셋

이 예에서는 Qlik DataMarketWeather for more than 2500 cities worldwide 데이터 소스에서 로드된 날씨 데이터를 사용합니다. 데이터 셋은 Qlik DataMarket의 다음 선택 내용을 기반으로 합니다.

  • Location: Sweden > Gällivare Airport, Kiruna Airport, Kramfors Sollefteå Airport, Luleå Airport, Ostersund Froson, Skellefteå Airport, Umeå Airport, Örnsköldsvik Airport
  • Date: All time
  • Measurement: Average of the 24 hourly temperature observations in degrees Celsius

로드된 데이터 셋에는 2010년부터 2017년까지 스웨덴 북부에 있는 여러 기상 관측소의 일일 평균 기온 측정이 포함됩니다.

측정값

Temperature degrees Celsius라는 이름과 Avg([Average of the 24 hourly temperature observations in degrees Celsius])라는 표현식으로 마스터 항목에 측정값을 작성하여 데이터 셋의 평균 기온 측정을 측정값으로 사용합니다.

시각화

시트에 상자 그림을 추가하고 다음 데이터 속성을 설정합니다.

  • 차원: Date(날짜) 및 Year(연도). 순서가 중요합니다. Date가 첫 번째 차원이어야 합니다.
  • 측정값: Temperature degrees Celsius. 마스터 항목으로 생성된 측정값입니다.

이 예에서는 기본 상자 그림 사전 설정인 표준(터키)과 수염 길이 1.5 내부 사분위수 범위를 사용합니다.

Box plot visualization.

발견

상자 그림은 일일 기온 측정의 분포를 시각화합니다. 시각화는 평균 기온 순서로 정렬됩니다. 각 연도의 평균 기온은 각 상자의 가운데 선으로 표시됩니다. 상자는 첫 번째 사분위수에서 세 번째 사분위수까지 뻗어 있으며 수염은 1.5 내부 사분위수 범위에 뻗어 있습니다. 또한 수염의 바깥쪽에 많은 이상값 포인트가 있습니다. 이상값 포인트 위에 마우스 포인터를 놓으면 세부 정보를 볼 수 있습니다.

상자 그림에서 2010년의 상자와 수염이 가장 긴 것을 볼 수 있습니다. 이는 2010년에 측정된 기온 분포가 가장 큰 것을 보여 줍니다. 또한 평균 기온이 가장 추운 해로 보입니다.

데이터 셋에는 첫 번째 달의 측정값만 포함되므로 2017의 범위는 작습니다.