跳到主要内容

使用影响分析来分析数据的谱系

在该页面上

使用影响分析来分析数据的谱系

使用影响分析查看数据源和应用程序的谱系。影响分析提供了数据集或应用程序谱系的图形视图,示出数据输入和数据输出。

谱系图显示组织中应用程序和数据的数据流。通过单击应用程序或数据集上的 并选择影响分析来访问谱系图。您还可以从数据集的详细信息部分访问谱系图。

谱系图

显示通过不同节点的数据流的谱系图

谱系图示出了数据在应用程序和数据集中的使用方式。它将应用程序和数据集可视化为节点。每个节点通过箭头连接,箭头显示数据的流动。例如,您可以查看哪些数据集节点由应用程序节点使用,以及哪些应用程序节点生成其他应用程序使用的数据集。您能够清楚地看到应用程序和数据集的使用情况和依赖关系。

权限

您必须能够查看应用程序或数据集,才能从应用中心查看项目的影响分析。在谱系图中,您可以看到属于您无权访问的应用程序和数据集的节点,但这些节点位于所选分析项目的谱系中。对于这些节点,您可以查看名称,但无法打开它们或查看详细信息。您可以选择查看这些节点的影响分析以查看其谱系。

默认情况下,影响分析在租户中不可用,必须由租户管理员提供。参阅管理影响分析

角色

谱系图支持组织中的不同角色。

数据管理员

谱系图可以帮助数据管理员了解数据的谱系,从而更容易添加元数据和解决质量问题。谱系图可提高运营效率,使您能够轻松识别数据集管道、使用情况和潜在重复。

应用程序开发人员和数据建模人员

谱系图提高了对数据源的信任和理解。查看数据集的完整历史记录(哪些应用程序使用它),并识别从现有数据集派生的新信息。相信数据是适合您的应用程序或数据模型的数据。

谱系图

谱系图显示数据源谱系中的节点。每个节点代表所选数据集或应用程序谱系中的一个步骤。每当应用程序加载或重新加载数据时,都会编译此谱系信息。如果您的应用程序最近没有重新加载,则谱系可能不完整或不准确。

谱系图表中显示以下节点类型:

  • 数据集:数据集是数据源,例如连接器或数据文件。数据集通常是作为 qvd 文件添加到空间或从应用程序生成的数据源。数据集节点显示数据集的位置,以及数据集是否位于共享或托管空间中。

  • 应用程序:应用程序节点表示使用谱系中数据源的 Qlik Sense 分析应用程序。应用程序节点将应用程序的名称和位置显示为 QCS (Qlik Cloud)。

谱系图中可用的节点是选定数据集或应用程序的输入,或者是数据集或应用程序的输出。

选择一个数据集或应用程序,将其指定为影响分析的根节点。它在谱系图中以深灰色边框标记。

根节点

谱系图的根节点,具有深灰色边框。

谱系图显示根节点的输入和输出节点的计数。输入节点是根节点的上游节点。典型的输入节点包括根节点使用的数据源或生成根节点使用的数据集的应用程序。输出节点是根节点的下游节点。典型的输出节点是将根节点用作数据源的应用程序,或根节点输出的数据集。

通过单击节点来选择它。选择节点后,该节点的谱系将以绿色高亮显示,您可以查看可用的节点详细信息。

突出显示所选节点的谱系及其详细信息

已选择一个节点,通过以绿色突出显示的其他节点显示其完整谱系。

节点详细信息

详细信息受您对该应用程序或数据集的访问权限限制。详细信息可以提供以下信息:

  • 名称

  • 描述

  • 标签

  • 位置

  • 空间

  • 所有者

  • 创建者

  • 上次修改

如果您没有查看应用程序或数据集的权限,则只能查看名称。

导航谱系图

单击并拖动以导航谱系图。您还可以使用导航按钮。可以单击 主页 以将谱系图居中放置在根节点上。使用“后退”和“前进”按钮在选择中移动。

谱系图导航

谱系图的导航按钮。

通过从详细信息面板选择节点并选择影响分析,可以更改所分析的根节点。

筛选谱系图可仅查看根节点的输入或输出。可以使用搜索框搜索特定节点。

搜索框和输入及输出筛选器

谱系图搜索框和输入及输出筛选器。

谱系中相同位置大的节点组可以折叠为一个组。可以展开这些节点以查看所有节点。还可以通过搜索折叠组中的节点来显示该节点。

下面有折叠节点的节点

下面有折叠节点的节点。

限制

影响分析和谱系图有以下限制:

  • Qlik Sense SaaS 中发布影响分析后未重新加载的应用程序在重新加载之前可能无法获得完整的谱系信息。如果在为租户启用影响分析后尚未加载某些节点,则可能会限制这些节点的详细信息。

  • 租户之外的数据集(如 SQL Server 或 Google Drive 连接)的节点详细信息仅限于数据集类型和名称。REST 连接仅显示它是 REST 数据。

使用谱系图

跟踪数据的来源和使用。跟踪数据谱系能帮助您了解数据来自何处,以及数据如何在组织中移动和使用。

应用程序开发人员可以使用谱系图来提高对数据源的信任和理解。可以回答类似以下问题:

  • 该数据集来自哪里?

  • 哪些应用程序使用该数据集?

  • 是否存在从此数据集衍生的其他数据集?

应用程序开发人员可以找到与主题领域相关的多个数据集。查看数据集的谱系,您可以看到它来自何处以及哪些其他应用程序在使用数据。

对于数据管理员,可以使用谱系图来提高操作效率、协作和数据质量。可以回答类似以下问题:

  • 未在应用程序中使用哪些数据集?

  • 哪些数据集可能重复?

  • 可以简化数据管道和转换吗?

  • 对数据管道中任何位置的数据集更改的下游影响是什么?

示例:用谱系图查找数据集

作为应用程序开发人员,您的数据管理员可能会向您提供您想要用其开发应用程序的数据集。在本例中,数据管理员使用来自应用程序 QVD Output-2 输出的 QVD 文件。在查看输出 QVD 文件的共享空间,我不能马上知道使用哪些数据集。

QVD 输出空间

QVD 输出空间,显示存储在其中的所有 QVD 文件。

单击其中一个数据集上的 ,在本例中为 EmployeeData,然后选择影响分析

EmployeeData 的影响分析

QVD 文件 EmployeeData 的影响分析。

跟进谱系之后,我可以看到这个数据集是 QVD Output-2 的输出。选择 QVD-Output 2 并查看影响分析。

QVD-Output-2 的影响分析

应用程序 QVD-Output2 的影响分析

您现在可以看到 QVD-Output-2 的所有输出,并知道在您的应用程序中使用哪些数据源。

示例:用谱系图诊断数据问题

作为应用程序开发人员,使用我的一个应用程序 App7 的客户报告应用程序中的某些数据已过时。当我运行加载脚本时,一切似乎都正常,所以我打开应用程序上的影响分析,查看它的输入。查看每个源 QVD 的详细信息,我发现其中一个 Support 已经有七天没有载入。

Support 详情

节点 Support.qvd 的谱系图中的详细信息。

您可以确定应用程序所有者,然后联系他们进行进一步调查。

示例:评估下游影响

作为一名数据管理员,我计划更新我的一个处理连接器数据的旧应用程序的加载脚本和输出。处理应用程序 QVD-Output-1 的影响分析可以确定下游影响,并查看哪些输出仍在使用。

QVD-Output-1 的影响分析

应用程序 QVD-Output-1 的影响分析。

有几个下游应用程序使用 QVD-Output-1 的输出。选择应用程序以查看应用程序所有者。

App1 的详细信息

应用程序 App1 的详细信息。

在进行计划更改之前,您需要与这些应用程序所有者沟通,以确保应用程序功能不受任何计划更改的影响。

示例:识别数据管道中的冗余

作为一名数据管理员,您决定检查数据管道,以确定是否需要简化和整合管道。您知道有两个应用程序可以处理您其中一个连接器的数据。选择一个应用程序进行影响分析,然后选择数据连接器以查看其影响分析。

数据连接器的影响分析

对数据连接节点的影响分析,显示下游数据沿袭的全部范围。

有两个处理器应用程序从这个连接器输出 QVD。这两个应用程序的输出有一些相似之处。可能有冗余,可以整合到一个单处理器应用程序中,并可能减少输出。更仔细地调查这些应用程序及其输出,看看是否可以简化它们。