管理数据集元数据
目录提供了关于数据集的几层关键描述性和技术元数据。这些信息有助于组织和分配资源和访问。
应用程序开发人员使用分析统计信息和数据采样,以获得创建应用程序和计划可视化的思路和方向。字段分析可以帮助数据分析师和业务用户更快地获得见解而不必先创建应用程序。无论您是数据管理员还是数据使用者;在分析数据资产时,了解数据集的来源并相信元数据的准确性可以增加信任度和信心。
查看数据集和元数据的权限
需要有在空间中查看数据集和数据集元数据的权限。这两个操作都映射到权限列出并使用空间中的数据源。有关更多信息,请参阅管理共享空间中的权限或管理托管空间中的权限。
- 查看数据集 > 列出并使用数据源
- 查看元数据 > 列出并使用数据源
数据集概览
数据集概览选项卡提供有关数据集的描述性和技术元数据的摘要。
概览标签含有:
- 技术元数据,如大小、所有者、文件类型,以及创建、上次修改和元数据刷新时间戳。已应用于数据集的元标签显示在该信息上方。
- 分类应用于数据集,以将其与用户定义的逻辑主题领域相关联。
执行以下操作:
-
从 Qlik Cloud 分析 中的主页选项卡中,选择左侧导航栏上的目录图标;或者从目录选项卡中,按类型:数据筛选。
将鼠标悬停在数据集磁贴上时,数据文件扩展名图标(例如:.XLSX)将更改为打开数据集按钮。源文件名显示在其下方。数据集继承原始数据文件的名称,可以进行编辑。
-
选择打开数据集以显示该数据集的概览。
详细信息 | 描述 |
---|---|
标记 | 已应用的元标签将显示(例如:tag1、tier3、upgrade 等) |
类型 | 文件类型扩展名(例如:.TXT) |
文件大小 | 文件或内容大小(例如:559 KB) |
源 | 初始数据资源名称(示例:MyVolumes.txt) |
空间 | 链接到目标空间的名称。根据权限的不同,空间可以是个人空间、共享空间、托管空间或数据空间。 |
所有者 | 内容的所有者(例如:JS Jan Smith) |
创建者 | 内容的所有者(例如:JS Jan Smith) |
创建日期 | 数据集对象创建的时间戳(示例:Feb 18, 2022 7:21 PM) |
修改日期 | 进行的最后一次修改的时间戳(示例:Feb 18, 2022 7:21 PM)当发生以下事件时,此值会发生更改:正在重新加载、重命名、更改描述、更改所有者、更改脚本。 |
字段 | 数据集中的列数。 |
行计数 | 数据集中的记录数。 |
查看者 | 过去 28 天内的唯一查看者数。 |
用于 | 使用特定数据集的应用程序数。 |
元数据刷新日期 | 从数据集源派生的元数据的最新刷新的时间戳,例如配置文件、记录数和列数。 |
标记资产
标签(也称为元标签)由用户应用,以帮助定位和组织数据。数据贡献者输入并将自由格式标记应用于数据集,以改进搜索和分类。对于出于许多原因需要对特定类型的数据资产进行筛选的数据管理员来说,这是一个有用的工具,包括成本中心资源的分发、销售和营销组织的细分以及权限和治理策略。应用程序开发人员和数据使用者使用标签来标识数据集,以提高效率和组织性。
已应用于数据集的元标签直接显示在“概述”选项卡中详细元数据的上方。
将元标签应用于数据集
执行以下操作:
选择打开数据集,然后选择 菜单,然后选择编辑数据集,或者从磁贴上的 菜单中选择编辑。将出现一个框,其中可以编辑数据集名称、描述和标签。已应用于数据集的标签都将显示在列表中。
在标签框中,输入由任何字符串组成的标签(多个标记中允许使用空格和特殊字符,最多 31 个字符)。分别输入每个标签,然后保存新标签。可以通过在标签上选择 x 来删除单个标签。
在元标签上筛选
执行以下操作:
如果目录标签未打开,请将其打开。在类型下拉列表下,选择数据。
选择所有筛选器以打开左侧筛选器面板;滚动到底部并输入要在其上筛选数据集的标签。
元数据刷新
目录中的数据集元数据遵循最近已知的状态元数据管理模型。此模型提供信息和操作,以便您始终了解派生元数据的最新情况。派生元数据反映数据的状态,不同于用户和系统控制的元数据。
选择绿色刷新 图标以刷新派生元数据。如果未检测到任何更改且元数据是最新的,则刷新 图标将显示为灰色。字段元数据刷新日期提供上次派生元数据刷新的时间。
检测到对架构的更改时,将启动元数据刷新。例如,如果数据发生更改,如果添加或删除数据,刷新图标将变为绿色。如果选择该图标,修改日期将更改,但元数据刷新日期不会更改,因为派生元数据没有更改。
派生元数据在不同的时间刷新,具体取决于数据集是上载到 Qlik Cloud 或者其是否为外部数据集,是新注册的还是已在系统中:
导入时,将自动分析新注册到目录中的数据。
- 没有派生元数据的系统中已有的数据可能从未计算过配置文件元数据。打开尚未计算概要文件的现有数据集将触发概要文件分析。如果此计算后文件有更新,刷新图标将再次显示为绿色,表示可以通过选择图标刷新数据集。
- 当系统检测到数据集表的架构发生更改时,元数据刷新图标为绿色,表示可以刷新派生元数据以反映数据的当前状态。
- 外部资源将始终显示绿色刷新图标。选择元数据刷新图标以确保派生元数据反映数据的当前状态。
配置数据集分类
分类可以应用于数据集,以将其与特定的用户定义主题区域相关联。分类可以是识别敏感信息或简单区分主题领域的有用工具。
执行以下操作:
在数据集概述选项卡中,找到分类部分,然后选择添加分类。输入描述此数据集所属主题区域的自由格式文本。如果要应用特定于行业或用例的用户定义分类,请输入一个描述,该描述将标识具有该策略或分组的数据集。
应用分类和标记的权限
编辑和应用分类和元标签需要权限。若需这些主题的详细信息,需要权限编辑属性并将属性应用于数据源:请参阅 管理共享空间中的权限 或 管理托管空间中的权限。
查看者和项目使用指标
查看者和使用指标允许您通过显示过去 28 天内唯一查看者的数量和趋势(“查看者”)以及当前使用特定项目的应用程序(“使用者”)的数量,直观地量化内容的价值。
默认情况下,租户中的使用情况指标处于打开状态,租户管理员可以关闭该指标。请参阅显示内容使用指标。如果在租户中看不到这些统计信息,则很可能它已关闭。
查看者指标
一个项目在过去 28 天的浏览量很好地表明了它的受欢迎程度。了解一个项目最近被浏览了多少次也有助于内容所有者对其工作获得有价值的见解。例如,被相对较少的用户查看的项目可能表明该项目不再有用,或者需要改进以提高其受欢迎程度。
项目使用指标
您可以查看在任何给定时间有多少应用程序正在使用特定项目,并可以轻松地进一步深入(通过单击数字)以查看影响分析。由于具有更多依赖项的项目通常具有更高的质量,因此了解此类依赖项提供了量化项目质量的有用方法。然后,数据和分析生产者可以利用更高质量的项目来创建额外的内容,而内容所有者可以确定对内容的任何更改的影响。
了解指标图标
下表描述了用于在网格视图中显示查看者和项目使用指标的图标。将鼠标悬停在图标上可查看包含详细信息的工具提示。请注意,用于指示查看器趋势的箭头图标也显示在列表视图中。
详细信息 | 描述 |
---|---|
过去 28 天内的唯一查看者数。箭头图标表示过去 28 天的趋势。例如,一个向上的箭头(如图所示)将表明 28 天中的第二个 14 天期间的唯一查看者比第一个 14 天期间的多。右箭头 () 表示过去 28 天内没有变化。向下的箭头表示过去 28 天的负趋势 ()。 | |
使用特定项目的应用程序数。您可以单击图标以查看影响分析。 |
指标位置
查看者和使用指标可在以下列出的位置获得。
在网格视图中的数据资产磁贴下方:
将鼠标悬停在指标图标上方可查看包含详细信息的工具提示。
在数据集详细信息视图(打开数据集时的默认视图)中:
将鼠标悬停在 图标上方可查看包含详细信息的工具提示。单击用于数字以查看影响分析。
应用程序中详细信息视图,可通过从 (操作)菜单中选择详细信息打开:
将鼠标悬停在 图标上方可查看包含详细信息的工具提示。 请注意,未显示应用程序的用于度量,因为它仅与数据集相关。
在列表视图中:
对于任何项目,请将鼠标悬停在查看者或用于数字上方,以获得包含更多信息的工具提示。您还可以单击用于列中的数字以查看影响分析。 请注意,未显示应用程序的用于度量,因为它仅与数据集相关。
选项
针对以下选项,选择 菜单:
- 添加至集合:集合是活动中心中对象的组织。选择该选项以:
- 搜索集合
- 创建集合
- 添加至集合
- 重命名:选择以编辑名称、描述或标签。
- 世系:请参阅分析应用程序、脚本和数据集的世系
- 影响分析:请参阅分析应用程序、脚本和数据集的影响分析
文件格式设置:请参阅上传数据集和编辑文件格式设置