跳到主要内容

使用数据管理验证和更正您的数据

借助Qlik Talend Cloud中的数据管理,您可以利用主题专家来验证和更正您的数据。使用您现有的语义类型和验证规则,确保数据格式一致。这通过领域专业知识的人工干预补救措施扩展了自动化管道。数据验证后,您可以将其重新注入原始数据源或任何下游系统。

信息注释Qlik Talend Cloud Enterprise 中提供

您创建一个冲刺,它是验证和补救工作的主要内容。该冲刺包含以下信息:

  • 源数据

  • 用于验证的数据架构

  • 该冲刺的所有者

  • 已定义的数据管理员

  • 用于冲刺数据的数据存储

  • 工作流设置

在冲刺期间,所有冲刺数据都存储在您自己的云数据仓库中,而不是在Qlik Talend Cloud中。目前,Snowflake 是唯一支持的云数据仓库。

您可以定义以下用户角色:

  • 冲刺任务所有者

    冲刺任务所有者可以验证数据管理员解决的记录。他们还可以访问已解决的记录并导出数据。

  • 数据专员

    数据管理员被分配记录以解决质量问题。

您在 数据管理Qlik Talend Data Integration 活动中心中创建冲刺。您可以创建解决冲刺,以更正和整理需要验证的数据集中一个或多个字段中的数据。工作流如下:

  1. 创建解决冲刺

    创建冲刺并定义要验证的数据。您可以使用 Talend Studio 作业填充冲刺,或导入包含数据的 CSV 文件。

    数据管理员被定义为执行验证。记录可以手动或自动分配。

  2. 在解决冲刺中工作

    数据管理员验证分配记录中的数据。

  3. 管理已解析的记录

    • 如果您使用Talend Studio作业填充了冲刺,则需要创建一个Talend Studio作业来检索已验证的记录,并将其返回到原始数据源或任何其他所需的目标。

    • 如果您使用CSV文件填充了冲刺,则冲刺通过将已验证的数据导出到CSV文件来结束。您可以通过导入导出的 CSV 文件,使用已验证的数据来更新数据源。

本页面有帮助吗?

如果您发现此页面或其内容有任何问题 – 打字错误、遗漏步骤或技术错误 – 请告诉我们!