跳到主要内容 跳到补充内容

复制数据

您可以将数据从受支持的数据源复制到任何受支持的目标。

数据复制过程包括以下操作:

  • 正在从数据源检索数据
  • 转换数据(可选)
  • 将数据加载到目标
  • 通过实时更改捕获保持数据最新

有关如何设置与数据源的连接的说明,请参阅连接到数据源

有关如何设置与目标数据库的连接的说明,请参阅连接至目标

设置复制任务:

  1. 单击右上角的新增按钮,然后从下拉菜单中选择创建数据项目

  2. 新建数据项目对话框中,执行以下操作:

    1. 为您的项目提供名称
    2. 选择要在其中创建项目的空间
    3. 任选地,提供描述
    4. 选择复制作为用例
    5. 如果要创建一个空项目而不配置任何设置,请清除打开复选框(可选)。
    6. 单击创建

      将出现以下情况之一:

      • 如果选择了新建数据项目对话框中的打开复选框(默认值),则项目将打开。
      • 如果清除了新建数据项目对话框中的打开复选框,则该项目将添加到项目列表中。您可以稍后通过从项目的 菜单中选择打开来打开项目。
  3. 项目打开后,单击复制数据

    项目打开后,单击复制数据

  4. 常规选项卡中,指定复制任务的名称和说明。然后单击下一步

  5. 选择源连接选项卡中,选择到源数据的连接。从操作列中的菜单中选择编辑,可以选择编辑连接设置。

    如果尚未创建到数据源的连接,则需要通过单击选项卡右上角的创建连接来创建连接。

    您可以使用左侧的筛选器筛选连接列表。可以根据源类型、网关、空间和所有者筛选连接。连接列表上方的所有筛选器按钮显示当前筛选器的数量。您可以使用此按钮关闭或打开左侧的筛选器面板。当前活动的筛选器也显示在可用数据连接列表的上方。

    您也可以从右侧的下拉列表中选择上次修改时间上次创建时间按字母数字顺序来对列表进行排序。单击列表右侧的箭头可以更改排序顺序。

    选择数据源连接后,可以选择单击选项卡右上角的测试连接(推荐),然后单击下一步

  6. 选择数据集选项卡中,选择要包含在复制任务中的表和/或视图。您还可以使用通配符并创建选择规则,如从数据库选择数据中所述。

  7. 选择目标连接选项卡中,从可用连接列表中选择目标,然后单击下一步。在功能方面,该选项卡与前面描述的选择源连接选项卡相同。

  8. 设置选项卡中,可以选择更改以下设置,然后单击下一步

    信息注释从 SaaS 应用程序源进行复制时,默认情况下会启用满负载复制模式,并且不能禁用。
    • 满负载:将选定源表中的数据加载到目标平台,并在必要时创建目标表。当任务启动时,满负载会自动发生,但如果需要,也可以手动执行。
    • 应用更改:使目标表持续更新对源表所做的任何更改。
    • 存储更改:将对源表的更改存储在“更改表”中(每个源表一个)。

      有关详细信息,请参阅存储更改

    信息注释当前不支持 ALTER TABLE DDL 操作。支持其他 DDL 操作,如 DROP TABLE 和 TRUNCATE TABLE。

    使用以下方法之一将更改应用于目标表:

    • 批量优化:这是默认设置。选择此选项后,将分批应用更改。进行预处理操作,以最有效的方式将事务分组为批。
    • 事务性:选择此选项可以按照提交的顺序单独应用每个事务。在这种情况下,可以确保所有表都具有严格的引用完整性。
  9. 摘要选项卡中,将显示数据管道的可视化信息。选择是打开 <name> 任务还是什么都不做,然后单击创建

    根据您的选择,将打开任务或显示项目列表。

  10. 如果选择打开任务,数据集选项卡将显示所选数据资产表的结构和元数据。这包括所有显式列出的表以及与选择规则匹配的表。

    如果要从数据源中添加更多表,请单击选择源数据

  11. 可选择如 数据复制设置 中所述更改任务设置。

  12. 您可以对数据集执行转换、过滤数据或添加列。

    有关更多信息,请参阅管理数据集

  13. 添加所需的转换后,可以通过单击验证数据集来验证数据集。如果验证失败,请先解决错误,然后再继续。

    有关更多信息,请参阅验证和调整数据集

  14. 准备好后,单击准备对数据任务进行编目并准备好执行。

  15. 准备好数据任务后,单击运行

    有关恢复任务和运行任务的其他方法的信息,请参阅高级运行选项

  16. 复制任务现在应该开始了,您可以在监视器中看到进度。有关更多信息,请参阅监视单个数据任务

设置数据集的加载优先级

您可以通过为每个数据集指定加载优先级来控制数据任务中数据集的加载顺序。例如,如果您想先加载较小的数据集,然后再加载较大的数据集,这就很有用。

  1. 点击加载优先级

  2. 为每个数据集选择加载优先级。

    默认加载优先级为正常。数据集将按以下优先顺序加载:

    • 最高

    • 较高

    • 正常

    • 较低

    • 最低

    具有相同优先级的数据集不分先后加载。

  3. 单击确定

信息注释来自 SaaS 应用程序源的数据集可能包含加载顺序依赖关系。设置负载优先级时应考虑这一点。

本页面有帮助吗?

如果您发现此页面或其内容有任何问题 – 打字错误、遗漏步骤或技术错误 – 请告诉我们如何改进!