从 CSV 文件创建解决冲刺任务
您可以从包含要验证的数据的 CSV 文件创建解决冲刺任务。
先决条件
在创建冲刺任务之前,您需要:
-
一个用于创建冲刺任务的空间。
冲刺任务所有者/创建者必须在该空间中拥有以下权限:可管理、可编辑、可查看、可查看数据
数据管理员必须拥有以下空间权限:可编辑、可查看、可查看数据
-
一个到 Snowflake 数据仓库的连接,您想要用它来存储冲刺数据。请勿使用数据网关用于该连接。
所有冲刺用户必须拥有连接空间中的以下权限:可编辑、可查看、可查看数据
您可以在Qlik Talend Data Integration活动中心的连接中创建连接。
有关 Snowflake 连接的更多信息,请参阅 Snowflake。
创建冲刺
若要创建解决冲刺,请在 Qlik Talend Data Integration 活动中心内的 数据管理 中点击 创建冲刺。
一般冲刺设置
-
名称
为冲刺添加名称。
-
空间
选择要在其中创建冲刺的空间。
-
说明
添加冲刺的描述。
-
冲刺任务群体的来源
选择文件。
导入包含您要验证的数据的 CSV 文件。
当您准备好继续定义数据架构时,点击 下一步。
定义数据架构
您现在可以验证用于验证数据的数据架构,并根据您的要求进行调整。数据质量指标会显示在每一列中,并且可能会突出显示无效数据。这是基于数据样本的。
锁定列
点击列上的...并选择锁定,以在冲刺中锁定该列进行编辑。列数据仍将可见,但数据管理员无法编辑。
排除列
点击列上的...并选择排除,以将该列从冲刺中排除。列数据对数据管理员不可见。
将语义类型应用于列
该列将默认使用其原生数据类型。您可以将语义类型应用于该列,以协助管理员验证数据。
-
选择列,然后点击
旁边的数据类型。您现在可以选择要应用于该列的语义类型。
您还可以更改每个列的名称和描述。
当您准备好继续定义数据存储时,请点击下一步。
向列添加验证规则
您可以向列应用验证规则,以便更容易发现无效数据。无效数据将在列中突出显示。
-
选择列并点击应用验证规则。您可以选择现有验证规则或创建新验证规则。
有关创建验证规则的详细信息,请参阅Creating a validation rule。
连接到数据存储
您必须连接到要用于存储冲刺数据的云数据仓库。Snowflake 是目前唯一支持的数据仓库。
-
选择到数据仓库的连接。
-
选择要使用的数据库。
-
选择是否要使用现有数据库架构或新数据库架构。
如果您选择 新建数据库架构,请设置新架构的名称。
-
在 已解决记录的表名 中设置用于已解决冲刺数据的表的名称。
当您准备好继续定义冲刺工作流的角色和其他设置时,请点击 下一步。
定义冲刺工作流的角色和设置
最后一步是定义角色和其他设置。
-
添加所有者
添加所有应成为冲刺所有者的用户。
-
添加数据管理员
为此冲刺添加所有数据管理员。
-
记录工作流程
您可以选择是否添加由冲刺所有者执行的第二个验证步骤。
信息注释如果一个用户既是冲刺负责人又是数据管理员,并且验证了一条记录,那么第二个验证步骤将被跳过。 -
记录分配
选择您是要自动分配记录,还是手动将记录分配给数据管理员。
-
自动
记录将以均匀分布的方式自动分配给数据管理员。记录将不会分配给那些不是数据管理员的冲刺负责人。
-
手动
记录最初将不会分配给数据管理员。冲刺任务所有者和数据管理员可以从未分配分配记录。
-
-
优先级
您可以为冲刺任务设置优先级。
准备好创建冲刺任务时,单击保存。
冲刺任务现已创建,并且已分配的数据管理员可以开始验证数据。