분포도를 사용하여 차원의 측정값 분포 보기
이 예는 날씨 데이터를 예로 사용하여 차원의 측정값 분포를 볼 수 있는 분포도를 작성하는 방법을 보여 줍니다.
데이터 집합
이 예에서는 다음 날씨 데이터를 사용합니다.
- Location: Sweden > Gällivare Airport
- Date range: all data from 2010 to 2017
- Measurement: Average of the 24 hourly temperature observations in degrees Celsius
로드된 데이터 셋에는 2010년부터 2017년까지 스웨덴 북부에 있는 한 기상 관측소의 일일 평균 기온 측정값이 포함됩니다.
측정값
Temperature degrees Celsius라는 이름과 Avg([Average of the 24 hourly temperature observations in degrees Celsius])라는 표현식으로 마스터 항목에 측정값을 작성하여 데이터 셋의 평균 기온 측정을 측정값으로 사용합니다.
시각화
시트에 분포도를 추가하고 다음 데이터 속성을 설정합니다.
- 차원: Date(날짜) 및 Year(연도). 순서가 중요합니다. Date가 첫 번째 차원이어야 합니다.
- 측정값: Temperature degrees Celsius. 마스터 항목으로 생성된 측정값입니다.
발견
분포도는 일일 기온 측정의 분포를 시각화합니다. 시각화는 연도별로 정렬되며 각 포인트는 기온 측정값을 나타냅니다.
시각화에서 2012년에 섭씨 -40도에 가까운 가장 낮은 기온 측정이 있음을 알 수 있습니다. 기온 측정 분포가 가장 큰 연도는 2016년인 것으로 보입니다. 분포도에 포인트가 많아 클러스터 및 이상값을 찾아내는 것이 어려울 수 있지만, 2017년에는 두 개의 저온 측정이 두드러집니다. 포인트 위로 마우스 포인터를 이동하면 세부 정보를 볼 수 있습니다.