상자 그림을 사용하여 숫자 데이터의 범위 및 분포 시각화
이 예는 일일 기온 측정값을 사용하여 상자 그림을 만들어 숫자 데이터의 범위 및 분포를 시각화하는 방법을 보여 줍니다.
데이터 집합
이 예에서는 다음 날씨 데이터를 사용합니다.
- Location: Sweden > Gällivare Airport
- Date range: all data from 2010 to 2017
- Measurement: Average of the 24 hourly temperature observations in degrees Celsius
로드된 데이터 셋에는 2010년부터 2017년까지 스웨덴 북부에 있는 한 기상 관측소의 일일 평균 기온 측정값이 포함됩니다.
측정값
Temperature degrees Celsius라는 이름과 Avg([Average of the 24 hourly temperature observations in degrees Celsius])라는 표현식으로 마스터 항목에 측정값을 작성하여 데이터 셋의 평균 기온 측정을 측정값으로 사용합니다.
시각화
시트에 상자 그림을 추가하고 다음 데이터 속성을 설정합니다.
- 차원: Date(날짜) 및 Year(연도). 순서가 중요합니다. Date가 첫 번째 차원이어야 합니다.
- 측정값: Temperature degrees Celsius. 마스터 항목으로 생성된 측정값입니다.
이 예에서는 기본 상자 그림 사전 설정인 표준(터키)과 수염 길이 1.5 내부 사분위수 범위를 사용합니다.
발견
상자 그림은 일일 기온 측정의 분포를 시각화합니다. 시각화는 평균 기온 순서로 정렬됩니다. 각 연도의 평균 기온은 각 상자의 가운데 선으로 표시됩니다. 상자는 첫 번째 사분위수에서 세 번째 사분위수까지 뻗어 있으며 수염은 1.5 내부 사분위수 범위에 뻗어 있습니다. 또한 수염의 바깥쪽에 많은 이상값 포인트가 있습니다. 이상값 포인트 위에 마우스 포인터를 놓으면 세부 정보를 볼 수 있습니다.
상자 그림에서 2010년의 상자와 수염이 가장 긴 것을 볼 수 있습니다. 이는 2010년에 측정된 기온 분포가 가장 큰 것을 보여 줍니다. 또한 평균 기온이 가장 추운 해로 보입니다.
데이터 셋에는 첫 번째 달의 측정값만 포함되므로 2017의 범위는 작습니다.