跳到主要内容 跳到补充内容

存储数据流数据集

以下数据流转换任务设置适用于使用数据流源的 Qlik Open Lakehouse 项目。

您可以使用数据流转换数据任务存储和转换数据流数据。数据流数据通常包含需要展平的嵌套结构和数组,并且在存储阶段需要转换功能。这些功能可用于数据流转换任务,使您能够在登陆您的数据流数据后立即应用转换。

存储设置

当数据平台是 Qlik Open Lakehouse 时,您可以设置流式转换数据任务的属性。

  • 单击设置

一般设置

  • 任务模式

    您可以更改流式转换任务模式的名称。默认名称是存储任务的名称。

  • 内部架构

    可以更改内部存储数据资产模式的名称。默认名称是附加了 _internal 的存储任务的名称。

  • 所有表格和视图的前缀

    可以为使用此任务创建的所有表和视图设置前缀。

    信息注释如果要在多个数据任务中使用数据库架构,则必须使用唯一的前缀。
  • 要使用的文件夹

    您可以更改流式转换任务存储文件夹。

  • 新数据集的加载设置

    • 只附加

      添加新记录而不修改现有数据。如果出现复制记录,则不强制执行键约束。

    • 应用更改 (合并)

      根据关键字段更新现有记录并插入新记录。

      如果您选择合并更改,您还可以选择以下选项:

      • 通过提供删除表达式软删除记录

        定义删除表达式以标记要删除的记录。

      • 保留历史记录(类型 2)

        保留已更改记录的以前版本。

  • 列取消嵌套

    • 保留嵌套列

      选择保留嵌套数据。

    • 展开到单独的列中

      默认行为是取消嵌套到单独的列中。

  • 目标表分区

    • 无分区

      创建新表时没有分区。

    • 按事件日期分区

      新表按事件摄取日期分区。

运行时设置

  • Lakehouse 集群

    您可以更改湖屋集群,但该集群必须支持数据流工作负载或混合工作负载。

模式演变设置

  • 在根级别添加列

    当在根级别向流式登陆任务添加新列时,此设置适用。

    • 应用于目标

      自动将新根级别列从流式登陆任务添加到流式转换任务。这是默认设置。

    • 忽略

      不添加新的根级别列。

    • 停止任务

      如果在数据流登陆任务中检测到新的根级别列,则停止转换任务。

  • 向结构中添加列

    当在数据流登陆任务中的现有嵌套结构中添加新字段时,此设置适用。

    • 应用于目标

      如果新字段已添加到登陆结构中,则自动将其添加到数据流转换任务中的现有结构。

    • 忽略

      不向现有结构添加新字段。

    • 停止任务

      如果 Streaming 登陆任务中的结构添加了新字段,则停止转换任务。

  • 更改字段数据类型

    • 忽略

      不更改数据类型。

    • 停止任务

      如果 Streaming 登陆任务中检测到数据类型更改,则停止转换任务。

本页面有帮助吗?

如果您发现此页面或其内容有任何问题 – 打字错误、遗漏步骤或技术错误 – 请告诉我们!