导出和导入数据管道
您可以将数据管道项目导出到一个文件中,该文件包含重建数据项目所需的一切。导出文件可以导入到同一个租户,也可以导入到另一个租户。例如,您可以使用它将项目从一个租户移动到另一个租户,或者制作项目的备份副本。您还可以从导出文件更新项目。
导出文件格式已从单个 JSON 文件更改成包含多个 JSON 文件的 ZIP 文件。旧 JSON 格式从 2026 年 2 月 2 日起不再支持导入。
导出您现有项目以享受新格式。
导出数据项目
您需要在项目所在的空间中至少拥有以下角色之一才能导出项目:
-
可编辑
-
可查看
-
可操作
要导出项目,请执行以下操作之一:
-
在数据集成 > 管道项目中,单击要导出的项目上的
,然后选择导出。
-
打开项目,单击右上角的
,然后选择导出。
项目将导出为 ZIP 文件,其文件名由项目名称、数据平台和时间戳组成。
导入项目
本部分介绍导入项目。您可以导入云数据仓库项目或 Qlik Cloud(通过 Amazon S3)项目。
您可以更改要使用的数据平台,但有以下限制:
-
无法将数据平台从云数据仓库更改为 Qlik Cloud,反之亦然。
-
无法将使用登陆到云文件存储的 Snowflake 项目更改为另一个数据平台,反之亦然。
导入项目之前
在开始导入项目之前,请考虑:
-
如果要导入到新租户或空间,请创建所需的所有新连接。
-
如果项目使用尚不存在的 SaaS 应用程序连接,则必须在开始导入之前创建连接并生成元数据。
-
如果要导入跨项目管道,则必须首先导入上游项目。
导入云数据仓库项目
您可以将导出的云数据仓库项目导入到导出它的同一个租户,也可以导入到另一个租户。当项目导入到原始数据项目租户以外的租户时,您需要为项目、暂存区和所有数据源定义新连接。
如果项目使用来自其他项目的任务,则必须映射项目和任务,除非空间和项目的名称相同。
-
在数据集成 > 管道项目中,单击新建并选择导入项目。
-
添加导出文件。您可以将其拖放到对话框中,也可以浏览以选择文件。
单击下一步。
-
为新项目设置项目属性。
您必须在空间中选择要将项目添加到的空间。
在数据平台中,您可以更改项目的数据平台以及与数据平台的连接。
如果您从另一个租户导入了项目,或者在上一步中更改了数据平台,则需要更改连接。
您可以更改与暂存区的连接。如果您从另一个租户导入了项目,或者在某些情况下,如果您在上一步中更改了数据平台,则需要执行此操作。
单击下一步。
-
为新项目设置默认项目设置。
您可以在所有架构的前缀中为项目中创建的数据架构添加前缀。当导入的项目与导出的项目位于同一个云数据仓库中时,这非常有用。
您还可以在数据库名称中设置默认名称。对于 Snowflake 项目,您可以设置默认的数据仓库名称,对于 Databricks 项目,您可以设置默认的目录名称。您可以将项目默认名称用于所有任务类型,或者为每种任务类型将名称设置为默认名称或自定义名称。
单击下一步。
-
设置连接和任务设置。
您可以将导入的源连接或跨项目源替换为使用相同连接器的连接。例如,如果导入的源连接是 MySQL,则替换连接也必须是 MySQL。如果您从另一个租户导入了项目,则需要执行此操作。
在任务设置(可选)中,您还可以更改要在原始项目中覆盖的任务设置。
-
准备就绪后,单击导入。
该项目将添加到 数据集成 主页。
导入以 Qlik Cloud 作为数据平台的项目
您可以将导出的 Qlik Cloud(通过 Amazon S3)项目导入到导出它的同一个租户,也可以导入到另一个租户。当项目导入到原始数据项目租户以外的租户时,您需要为项目、暂存区和所有数据源定义新连接。
无法将数据平台从 Qlik Cloud 更改为云数据仓库,例如 Snowflake。
-
在数据集成 > 管道项目中,单击新建并选择导入项目。
-
添加导出文件。您可以将其拖放到对话框中,也可以浏览以选择文件。
单击下一步。
-
名称
更改项目的名称。默认名称是带有 Imported_ 前缀的原始项目名称。
-
空间
选择要将项目添加到的空间。 -
描述
添加或编辑项目的描述。 -
将 QVD 文件存储在:
选择生成 QVD 文件的位置。
-
Qlik 托管存储
-
客户托管存储
由您管理的 Amazon S3 存储。
-
-
数据连接
如果您选择了客户托管存储,则可以更改与 Amazon S3 存储区的连接。
如果您从另一个租户导入了项目,则需要执行此操作。
-
与暂存区的连接
您可以更改与 Amazon S3 暂存区的连接。
如果您从另一个租户导入了项目,或者在某些情况下,如果您在上一步中更改了数据平台,则需要执行此操作。
-
单击下一步。
-
为原始版本中添加的任务设置连接
您可以将导入的源连接替换为使用相同连接器的连接。例如,如果导入的源连接是 MySQL,则替换连接也必须是 MySQL。如果您从另一个租户导入了项目,则需要执行此操作。
-
在任务设置(可选)中,您可以更改要在原始项目中覆盖的任务设置。
-
准备就绪后,单击导入。
该项目将添加到 数据集成 主页。
更新项目
您可以从导出文件更新项目。这将替换数据管道中的所有任务,但不会替换连接和设置。未包含在导入项目中的数据任务将被删除。
例如,您可以将从开发数据空间导出的项目导入到生产数据空间中的项目,以更新生产项目。
在开始更新项目之前:
-
如果要在更新之前备份项目,请通过单击
,然后单击导出来导出它。
-
在更新项目之前,您必须停止将从数据管道中删除的所有任务。
-
如果项目使用尚不存在的 SaaS 应用程序连接,则必须在开始导入之前创建连接并生成元数据。
-
确保导入的项目使用相同的云数据平台,例如 Snowflake。
要更新项目:
-
打开要更新的项目。
-
单击
,然后单击导入。
-
选择或拖放要导入的文件。
-
对项目和导入项目之间不同的映射连接进行任何所需的更改。
例如,导入的项目可能使用名为 SQL1 的源连接,而此项目使用名为 SQL2 的类似连接。在这种情况下,请在为原始版本中添加的任务设置连接中将导入的连接映射到 SQL2。
信息注释选择要映射的连接时,您可以创建新的数据库连接,但不能创建 SaaS 应用程序连接。准备就绪后,单击导入。
现在,项目已根据导入的文件进行更新。您可能需要验证并同步通过导入更新的数据任务。
最佳实践
以下是导入和导出项目时的一些一般最佳实践。
-
避免将同一数据集添加到两个项目并将一个项目导入到另一个项目。这可能会产生难以解决的冲突,并可能导致重新创建数据集:
信息注释将数据集添加到任务时,它会获得一个内部标识符。内部标识符用于允许在管道中进行无缝重命名和其他元数据操作。在单独的项目或分支中创建相同的数据集时,内部标识符将不同,从而在将一个项目导入到另一个项目时导致冲突。这可能会导致准备过程删除并重新创建数据集,即使它具有相同的名称。
限制
-
导出管道时不包含通知。您需要在导入的管道中设置新通知。
-
导出项目时不包含保存的 SQL 工作台脚本。
如果将项目作为新项目导入,则保存的 SQL 工作台脚本为空。
如果导入以更新现有项目,则现有的已保存 SQL 工作台脚本不会更改。
-
用于导入的 zip 文件必须直接包含项目文件,而不是在嵌套的子文件夹中。
在 mac OS 中创建 zip 文件时,如果单击文件夹并选择将其压缩,则 zip 文件将包含一个包含这些文件的嵌套子文件夹,这意味着无法导入该 zip 文件。
-
以下情况可能会产生难以解决的冲突:
-
在两个项目中对同一数据集进行更改。
-
导出项目 1。
-
将项目 1 导入到项目 2 中。
-
-
不要设计在项目之间创建循环或相互依赖关系的管道。不支持导出和导入此类项目。
-
导入带有已注册数据和存储任务的旧项目(在引入 JSON 支持之前)时,源上的 JSON 字段被映射到 BLOB。本机类型仍保留在已注册数据上,例如 Snowflake 上的 Variant。在添加 JSON 支持后导入时,逻辑类型可能会更改为 JSON。