从 CSV 文件创建解决冲刺任务
您可以从包含要验证的数据的 CSV 文件创建解决冲刺任务。
先决条件
在创建冲刺任务之前,您需要:
-
一个用于创建冲刺任务的空间。
冲刺任务所有者/创建者必须在该空间中拥有以下权限:可管理、可编辑、可查看、可查看数据
数据管理员必须在该空间中拥有以下权限:可编辑、可查看、可查看数据
-
与您希望用于存储冲刺任务数据的 Snowflake 数据仓库的连接。请勿使用数据网关用于该连接。
所有冲刺用户必须在连接空间中拥有以下权限:可编辑、可查看、可查看数据
您可以在 Qlik Talend Data Integration 活动中心中的 连接 中创建连接。
有关 Snowflake 连接的更多信息,请参阅 Snowflake。
创建冲刺
若要创建解决冲刺,请在 Qlik Talend Data Integration 活动中心内的 数据管理 中点击 创建冲刺。
通用冲刺设置
-
名称
为冲刺添加名称。
-
空间
选择要在其中创建冲刺的空间。
-
说明
添加冲刺的描述。
-
冲刺任务群体的来源
选择文件。
导入包含您要验证的数据的 CSV 文件。
当您准备好继续定义数据架构时,点击 下一步。
定义数据架构
您现在可以验证用于验证数据的数据架构,并根据您的要求进行调整。数据质量指标会显示在每一列中,并且可能会突出显示无效数据。这是基于数据样本的。
锁定列
点击列上的...并选择锁定,以在冲刺中锁定该列进行编辑。列数据仍将可见,但数据管理员无法编辑。
排除列
点击列上的...并选择排除,以将该列从冲刺中排除。列数据对数据管理员不可见。
将语义类型应用于列
该列将默认使用其原生数据类型。您可以将语义类型应用于该列,以协助管理员验证数据。
-
选择列,然后点击
旁边的数据类型。您现在可以选择要应用于该列的语义类型。
您还可以更改每个列的名称和描述。
当您准备好继续定义数据存储时,请点击下一步。
向列添加验证规则
您可以向列应用验证规则,以便更容易发现无效数据。无效数据将在列中突出显示。
-
选择列并点击应用验证规则。您可以选择现有验证规则或创建新验证规则。
有关创建验证规则的详细信息,请参阅Creating a validation rule。
连接到数据存储
您必须连接到要用于存储冲刺数据的云数据仓库。Snowflake 是目前唯一支持的数据仓库。
-
选择数据仓库的连接。
-
选择要使用的数据库。
-
选择是要使用现有数据库架构,还是新的数据库架构。
如果您选择新数据库架构,请设置新架构的名称。
-
设置用于已解决的冲刺数据的表的名称,在已解决记录的表名中。
准备好继续定义冲刺工作流的角色和其他设置时,点击下一步。
定义冲刺工作流的角色和设置
最后一步是定义角色和其他设置。
-
添加所有者
添加所有应该成为冲刺所有者的用户。
-
添加数据管理员
为此冲刺添加所有数据管理员。
-
记录工作流程
您可以选择是否要添加由冲刺所有者执行的第二个验证步骤。
信息注释如果一个用户既是冲刺所有者又是数据管理员并验证了一条记录,则会跳过第二个验证步骤。 -
记录分配
选择是否要自动分配记录,或者是否要手动将记录分配给数据管理员。
-
自动
记录会自动均匀分配给数据管理员。记录不会分配给不是数据管理员的冲刺任务负责人。
-
手动
记录最初不会分配给数据管理员。冲刺任务负责人和数据管理员可以从未分配中分配记录。
-
-
优先级
您可以为冲刺设置优先级。优先级用于在冲刺列表中对冲刺进行排序。
准备好创建冲刺时,单击保存。
冲刺任务现已创建,并且已分配的数据管理员可以开始验证数据。