跳到主要内容 跳到补充内容

管理数据集

您可以管理登陆存储转换数据集市复制数据任务中包含的数据集,以创建转换、筛选数据和添加列。

包含的数据集列在设计视图的数据集下。您可以使用列选择器 (列选择器) 选择要显示的列。

数据任务的设计视图中的数据集

数据任务的设计视图中的数据集

转换规则和显式转换

您可以执行全局和显式转换。

转换规则

您可以通过创建一个转换规则来执行全局转换,该规则使用 % 作为作用域中的通配符,以应用于所有匹配的数据集。

变换规则由受影响属性上的深紫色角表示。

显式转换

创建显式转换:

  • 使用编辑更改列属性时

  • 在数据集上使用重命名时。

  • 添加列时。

显式变换覆盖全局变换,并由受影响属性上的浅紫色角表示。

筛选数据集

信息注释筛选数据集的能力可用于登陆数据任务,其通过 Qlik 数据网关 - 数据移动、存储和转换数据任务登陆数据。

如果需要,可以筛选数据以创建行的子集。

  • 单击筛选器

有关详细信息,请参阅筛选数据集

重命名数据集

您可以重命名数据集。

  • 单击数据集上的 ,然后单击重命名

添加列

如果需要,可以使用行级转换添加列。

  • 单击添加列

有关详细信息,请参阅向数据集添加列

编辑列

可以通过选择列并单击编辑来编辑列属性。

  • 名称

  • 密钥

    将列设置为主键。也可以通过在关键列中选择或取消选择来设置关键点。

  • 可为 Null

  • 数据类型

    设置列的数据类型。对于某些数据类型,可以设置其他特性,例如长度

删除列

您可以从数据集中删除一列或多列。

  • 选择要删除的列,然后单击删除

如果要查看删除的列,请单击显示删除的列。删除的列用删除线文本表示。您可以通过选择删除的列并单击恢复来检索该列。

提示注释要删除添加的列,请选择该列并单击还原

恢复对列的显式更改

您可以将所有显式更改还原为一个或多个列。

  • 选择要还原更改的列,然后单击还原

不会恢复对全局转换规则的更改。

如果还原添加的列,它将被删除。

数据集设置

您可以更改数据集的设置。默认设置是继承数据资源的设置,但也可以将设置显式更改为“开”或“关”。

  • 单击数据集上的 ,然后单击设置

查看数据

在设计数据管道时,您可以查看数据示例以查看和验证数据的形状。

必须满足以下要求:

  • Qlik Management Console 中的租户级别上启用了查看数据的功能。

    启用设置>特性控制 > 数据集成 中查看数据。

  • 您将在数据连接所在的空间中分配可以查看数据角色。

  • 您将在数据项目所在的空间中分配可以查看角色。

要在设计视图的数据集选项卡中查看示例数据,请执行以下操作:

  • 单击物理对象中的查看数据

将显示数据示例。可以使用行数设置要包含在示例中的数据行数。

要在数据集和表之间进行更改,请执行以下操作:

  • 选择数据集以查看数据的逻辑表示形式。

  • 选择物理对象以在数据库中以表和视图的形式查看物理表示。

    新闻注释如果尚未创建物理表达,则此选项不可用。

您可以通过两种方式筛选样本数据:

  • 使用 筛选器 筛选要检索的样本数据。

    例如,如果您使用筛选器 ${OrderYear}>2023,并且行数设置为 10,那么您将从 2024 年获得 10 个订单的样本。

  • 按特定列筛选示例数据。

    这只会影响现有的样本数据。如果您使用 筛选器 以只包括 2024 年的订单,并将列筛选器设置为显示 2022 年的订单时,结果为空样本。

您也可以按特定列对数据样本进行排序。排序只会影响现有的样本数据。如果您使用 筛选器 只包括 2024 年的订单并反转排序顺序,则示例数据仍将只包含 2024 年以来的订单。

可以在数据视图中隐藏列:

  • 通过单击列上的 ,然后单击隐藏列来隐藏单个列。

  • 通过单击任意列上的 ,然后单击显示列,隐藏多个列。这样可以控制视图中所有列的可见性。

验证和调整数据集

您可以验证数据任务中包含的所有数据集。

展开验证并调整以查看所有验证错误和设计更改。

验证数据集

  • 单击验证数据集以验证数据集。

验证包括检查:

  • 所有表都有一个主键

  • 没有缺少的属性。

  • 没有重复的表名或列名。

您还将获得与源代码相比的设计更改列表:

  • 添加了表和列

  • 删除的表和列

  • 重命名的表和列

  • 更改的主键和数据类型

展开验证并调整以查看所有验证错误和设计更改。

  • 修复验证错误,然后再次验证数据集。

  • 除更改的主键或数据类型外,大多数设计更改都可以自动调整。在这种情况下,您需要同步数据集。

准备数据集

如果可能的话,您可以准备数据集以调整设计更改,而不会丢失数据。如果有设计更改无法在不丢失数据的情况下进行调整,则可以选择在有数据丢失的情况下从源重新创建表。

这需要停止任务。

  • 单击 ,然后单击准备

准备数据集后,请在重新启动存储任务之前验证数据集。

重新创建数据集

您可以从源重新创建数据集。当您重新创建数据集时,数据资产中会有数据丢失。只要您有源数据,就可以从源重新加载它。

这需要停止任务。

  • 单击 ,然后重新创建

限制

  • 在 GoogleBigQuery 中,如果删除或重命名列,这将重新创建表并导致数据丢失。

本页面有帮助吗?

如果您发现此页面或其内容有任何问题 – 打字错误、遗漏步骤或技术错误 – 请告诉我们如何改进!