跳到主要内容

使用框图可视化数值数据的范围和分布

在该页面上

使用框图可视化数值数据的范围和分布

该示例示出如何使用来自 Qlik DataMarket 的每日温度测量创建框图来可视化数值数据的范围和分布。

Box plot visualization.

数据集

在本示例中,我们将使用 Qlik DataMarket 中来自 Weather for more than 2500 cities worldwide 数据源的天气数据。数据集基于 Qlik DataMarket 中的以下选择项:

  • Location: Sweden > Gällivare Airport, Kiruna Airport, Kramfors Sollefteå Airport, Luleå Airport, Ostersund Froson, Skellefteå Airport, Umeå Airport, Örnsköldsvik Airport
  • Date: All time
  • Measurement: Average of the 24 hourly temperature observations in degrees Celsius

已加载的数据集包含来自瑞典北部大量气象站的 2010 年至 2017 年期间每日平均温度测量

备注: DataMarketQlik Sense Enterprise on Kubernetes 中不可用。

度量

我们通过在主条目中创建名为 Temperature degrees Celsius 的 .measure 文件以及表达式 Avg([Average of the 24 hourly temperature observations in degrees Celsius]),将数据集中的平均温度测量用作度量。

可视化

我们向工作表添加框图,并设置以下数据属性:

  • 维度Date(日期)和 Year(年)。顺序很重要;Date 需要作为第一维度。
  • 度量Temperature degrees Celsius;创建为主条目的度量。

在该示例中,我们将默认框图预设标准 (Tukey) 用于须线长度 1.5 个四分位距

Box plot visualization.

探索

框图将每日温度测量的分布可视化。可视化以平均温度顺序排序。每年的平均温度通过每个框中的中线显示。框中第一四分位延伸到第三四分位,并且须线延伸 1.5 四分位距。还存在大量异常值、位于虚线外部的点。您可将鼠标指针悬停在异常值上方并查看详细信息。

在框图中,我们可看到 2010 年具有最长的框和须线。这表明 2010 年具有最大的已测量温度分布。从平均温度上看,它似乎是最冷的一年。

2017 年的范围较小,因为数据集仅包含来自该年第一个月的测量。