跳到主要内容 跳到补充内容

连接到 SaaS 应用程序

您可以在 Qlik Cloud 数据集成 中登陆或复制来自大量 SaaS 应用程序的数据。

要查看所有支持的应用程序,请转到Supported SaaS applications

Qlik Sense Enterprise SaaS Government 注释Qlik Cloud 政府 不支持连接到 SaaS 应用程序。

为了快速开发用于不断增长的云应用程序源的连接器,Qlik 正在创建用于使用标准 API 和生成式 AI 技术的 Qlik Cloud 数据集成 的应用程序连接器。

连接到 SaaS 应用程序

连接到 SaaS 应用程序需要设置 数据网关 - 数据移动。有关详细信息,请参阅Qlik 数据网关 - 数据移动

  1. 连接到 SaaS 应用程序的第一步是向数据源添加连接。您可以用几种方法做到这一点。

    • 单击列出源连接的创建连接

    • 单击顶部栏中的新增,然后单击数据连接

    选择类别中的应用程序以过滤 SaaS 应用程序连接器的连接器列表。

    也可以从最近使用的连接器中进行选择。

  2. 选择要连接到的应用程序。

  3. 填写连接详细信息以验证连接。对于不同的 SaaS 应用程序,连接细节和身份验证过程是不同的。

    有关详细信息,请转到连接到 SaaS 应用程序 并选择您的数据源。

    选择打开连接元数据,然后在准备好后单击创建

  4. 将显示元数据管理器,您可以在其中定义连接的元数据。

    单击生成元数据以基于对源数据的采样创建元数据。

    有关元数据加载的更多信息,请参阅扫描数据以生成元数据

    提示注释也可以单击导入元数据来导入已生成的元数据定义。有关详细信息,请参阅导出和导入元数据
  5. 选择要使用的源数据集,然后单击确定

  6. 选择用于扫描数据的选项。您可以执行完全扫描或快速扫描。

    全面扫描会更准确,但可能需要很长时间才能处理。如果选择全扫描,则在登陆数据时,该数据将用于初始加载。

    您还可以设置默认的元数据设置。

    准备好后,单击生成元数据

元数据生成完成后,您可以在登录或入门任务中使用该连接。

更改处理

您可以使用两种不同的更新方法从 SaaS 应用程序获取数据。更新方法在登陆数据任务的设置中设置。一旦准备好登陆数据任务,就不可能更改更新方法。

  • 更改数据捕获 (CDC)

    登陆以满负载开始。然后使用基于日期字段的增量加载来保持登陆数据的最新状态。CDC 可能并非所有数据源都支持。

    信息注释不支持删除。这意味着,如果在源中删除某行,则不会在平台数据中删除该行。如果删除处理很重要,请改用重新加载并比较

    可以在设置 > 运行时下的登陆数据任务中设置从源读取更改之间的间隔。

  • 重新加载并比较

    平台仅从源执行满负载。如果您的源不支持 CDC,但可以与任何受支持的数据源一起使用,则此选项非常有用。

    您可以定期安排重新加载。

限制

变更数据捕获 (CDC) 不支持 SaaS 应用程序返回的某些表。在这种情况下,您将在验证错误中看到一条警告消息。您可以执行以下操作之一:

  • 从数据任务中删除表。

  • 将数据任务的更新方法更改为重新加载并比较

管理元数据

创建到数据源的连接时,还需要为包含的数据集定义元数据。元数据在生成模式时用于规范化和定义适当的目标表。元数据允许您选择要在指向目标的复制中使用的列。当从源返回嵌套结构时,输出表将被规范化以保持数据的粒度。

您可以执行以下操作之一:

  • 通过对源表中的数据进行采样生成元数据

  • 导入从具有相同类型数据源的连接导出的元数据。

通过在数据连接中单击要管理的连接上的元数据,可以管理连接的元数据。

扫描数据以生成元数据

信息注释当使用 SAP ODP 作为源时,扫描数据以生成元数据是不相关的。

生成元数据时,可以选择对数据执行完全扫描,或在元数据加载中执行快速扫描。

  • 全面数据扫描会更准确,但可能需要很长时间才能处理。

  • 快速数据扫描基于数据样本。这会更快,但没有那么准确。您可以通过数据样本数选择要在扫描中使用的数据采样数。增加数字以提高准确性。

    数据样本中包含的记录数取决于使用的数据源。

您还可以选择如何设置字符串列的大小

  • 固定

    将固定字符串列大小设置为介于 1 和 10000 之间。

  • 基于数据值

    将字符串列大小设置为数据样本中字段的最长观测值,再乘以相乘中的值。

    如果字段对样本中所有行都为空,列字符串大小将设置为没有值时的默认大小中的值。

选择数据集

您可以将数据集添加到元数据中。

  • 单击选择数据集

    现在,您可以选择要添加到元数据中的数据集。如果数据集已包含在元数据中,则会重新加载该数据集。

    在完成操作时,单击确定

删除数据集

  • 要从元数据中删除数据集,请单击数据集上 ... 在,然后单击删除

编辑数据集中的列

您可以编辑数据集中的列,将其设置为键、使其可以为 null 或更改数据类型。

  1. 选择数据集。

  2. 选择要编辑的列。

  3. 单击编辑

删除数据集中的列

  1. 选择数据集。

  2. 选择要编辑的列。

  3. 单击删除

导出和导入元数据

您可以从一个连接导出元数据,然后将其导入另一个连接。

  • 单击导出元数据以导出元数据。

  • 单击导入元数据可从导出的元数据文件中添加元数据。元数据文件必须已从相同类型的数据源导出。如果存在具有相同名称的表,则可以在导入时跳过这些表,也可以覆盖现有元数据。

重新加载元数据

当源数据发生结构更改时,必须重新加载连接的元数据。

  • 要重新加载所有数据集的元数据,请单击重新加载元数据

  • 要重新加载特定数据集,请单击数据集上的 ...,然后单击重新加载元数据

有关元数据加载的更多信息,请参阅扫描数据以生成元数据

本页面有帮助吗?

如果您发现此页面或其内容有任何问题 – 打字错误、遗漏步骤或技术错误 – 请告诉我们如何改进!