Перейти к основному содержимому Перейти к дополнительному содержимому

Визуализация диапазона и распределения числовых данных при помощи блочной диаграммы

В этом примере показан порядок создания блочной диаграммы для визуализации диапазона и распределения числовых данных с использованием суточных показателей температуры.

Box plot visualization.

Набор данных

В этом примере будут использоваться следующие данные о погоде.

  • Location: Sweden > Gällivare Airport
  • Date range: all data from 2010 to 2017
  • Measurement: Average of the 24 hourly temperature observations in degrees Celsius

Загруженный набор данных содержит значения среднесуточной температуры, полученные метеостанцией на севере Швеции в период с 2010 по 2017 гг.

Мера

В этом наборе данных значение средней температуры используется в качестве меры. Для этого в основных элементах создайте меру с именем Temperature degrees Celsius и выражение Avg([Average of the 24 hourly temperature observations in degrees Celsius]).

Визуализация

Добавьте блочную диаграмму на лист и укажите следующие свойства данных.

  • Измерение: Date (дата) и Year (год). Порядок имеет большое значение. Измерение Date должно быть первым.
  • Мера: Temperature degrees Celsius — мера, которая была создана в качестве основного элемента.

В этом примере используются предустановки блочной диаграммы по умолчанию: Стандартная (Тьюки) с длиной усов 1,5 интерквартильной широты.

Box plot visualization.

Исследование

Блочная диаграмма визуализирует распределение значений среднесуточной температуры. Сортировка визуализации осуществляется по значениям средней температуры. Средняя температура за каждый год отображается средней линией в каждом блоке. Блок растягивается от первого квартиля до третьего квартиля, а усы растягиваются на 1,5 интерквартильной широты. Также имеется ряд отдельных значений — точки, расположенные за пределами усов. Наведите указатель мыши на отдельную точку, чтобы просмотреть сведения.

На этой блочной диаграмме видно, что 2010 г. имеет самый длинный блок и усы. Это означает, что в 2010 г. было самое большое распределение температур. Кроме того, по средним значениям это самый холодный год.

Диапазон 2017 г. небольшой, поскольку набор данных содержит измерения только для первых месяцев года.

Помогла ли вам эта страница?

Если вы обнаружили какую-либо проблему на этой странице и с ее содержанием — будь то опечатка, пропущенный шаг или техническая ошибка, сообщите нам об этом, чтобы мы смогли ее исправить!