기본 콘텐츠로 건너뛰기 보완적인 콘텐츠로 건너뛰기

분포도를 사용하여 차원의 측정값 분포 보기

이 예는 날씨 데이터를 예로 사용하여 차원의 측정값 분포를 볼 수 있는 분포도를 작성하는 방법을 보여 줍니다.

Distribution plot.

데이터 집합

이 예에서는 다음 날씨 데이터를 사용합니다.

  • Location: Sweden > Gällivare Airport
  • Date range: all data from 2010 to 2017
  • Measurement: Average of the 24 hourly temperature observations in degrees Celsius

로드된 데이터 셋에는 2010년부터 2017년까지 스웨덴 북부에 있는 한 기상 관측소의 일일 평균 기온 측정값이 포함됩니다.

측정값

Temperature degrees Celsius라는 이름과 Avg([Average of the 24 hourly temperature observations in degrees Celsius])라는 표현식으로 마스터 항목에 측정값을 작성하여 데이터 셋의 평균 기온 측정을 측정값으로 사용합니다.

시각화

시트에 분포도를 추가하고 다음 데이터 속성을 설정합니다.

  • 차원: Date(날짜) 및 Year(연도). 순서가 중요합니다. Date가 첫 번째 차원이어야 합니다.
  • 측정값: Temperature degrees Celsius. 마스터 항목으로 생성된 측정값입니다.
차원 Date(날짜), Year(연도) 및 측정값 Temperature degrees Celsius가 있는 분포도

Distribution plot.

발견

분포도는 일일 기온 측정의 분포를 시각화합니다. 시각화는 연도별로 정렬되며 각 포인트는 기온 측정값을 나타냅니다.

시각화에서 2012년에 섭씨 -40도에 가까운 가장 낮은 기온 측정이 있음을 알 수 있습니다. 기온 측정 분포가 가장 큰 연도는 2016년인 것으로 보입니다. 분포도에 포인트가 많아 클러스터 및 이상값을 찾아내는 것이 어려울 수 있지만, 2017년에는 두 개의 저온 측정이 두드러집니다. 포인트 위로 마우스 포인터를 이동하면 세부 정보를 볼 수 있습니다.

이 페이지가 도움이 되었습니까?

이 페이지 또는 해당 콘텐츠에서 오타, 누락된 단계 또는 기술적 오류와 같은 문제를 발견하면 개선 방법을 알려 주십시오!