使用框图可视化数值数据的范围和分布
该示例示出如何使用每日温度测量创建框图来可视化数值数据的范围和分布。
数据集
在本 中,我们将使用以下天气数据。
- Location: Sweden > Gällivare Airport
- Date range: all data from 2010 to 2017
- Measurement: Average of the 24 hourly temperature observations in degrees Celsius
已加载的数据集包含来自瑞典北部气象站的 2010 年至 2017 年期间每日平均温度测量
度量
我们通过在主条目中创建名为 Temperature degrees Celsius 的 .measure 文件以及表达式 Avg([Average of the 24 hourly temperature observations in degrees Celsius]),将数据集中的平均温度测量用作度量。
可视化
我们向工作表添加框图,并设置以下数据属性:
- 维度:Date(日期)和 Year(年)。顺序很重要;Date 需要作为第一维度。
- 度量:Temperature degrees Celsius;创建为主条目的度量。
在该示例中,我们将默认框图预设标准 (Tukey) 用于须线长度 1.5 个四分位距。
探索
框图将每日温度测量的分布可视化。可视化以平均温度顺序排序。每年的平均温度通过每个框中的中线显示。框中第一四分位延伸到第三四分位,并且须线延伸 1.5 四分位距。还存在大量异常值、位于虚线外部的点。您可将鼠标指针悬停在异常值上方并查看详细信息。
在框图中,我们可看到 2010 年具有最长的框和须线。这表明 2010 年具有最大的已测量温度分布。从平均温度上看,它似乎是最冷的一年。
2017 年的范围较小,因为数据集仅包含来自该年第一个月的测量。