连接到 SaaS 应用程序
您可以在 Qlik Cloud 数据集成 中获取来自大量 SaaS 应用程序的数据。
要查看所有支持的应用程序,请转到Supported SaaS applications。
为了快速开发用于不断增长的云应用程序源的连接器,Qlik 正在创建用于使用标准 API 和生成式 AI 技术的 Qlik Cloud 数据集成 的应用程序连接器。
在数据完整性、安全性和可靠性方面,开发工作将遵循与我们现有连接器相同的指导方针。但为了加快交付,这些连接器通常会针对特定的用例构建,并标记为预览,直到可以提供全面的用例覆盖。
数据连接器 | 应用程序连接器 | |
---|---|---|
用例 | 完整或接近完整的用例覆盖范围。 | 部分或特定用例覆盖范围。 |
已标记 | 未标记 | (预览) |
SLA(服务水平协议) | 基于定价计划的完整 SLA。 |
基于定价计划的完整 SLA。 可能缩短了响应时间。 |
架构设计流程 | 使用本机 SQL 的自动发现。 | 利用应用程序 API。 |
请求新连接器 | 请参阅现有的支持矩阵和战略路线图。 | 请联系您的客户或客户成功经理。 |
定价 | 每月基于容量的使用情况。 | 每月基于容量的使用情况。 |
本视频介绍如何连接到 SaaS 应用程序。
连接到 SaaS 应用程序
连接到 SaaS 应用程序需要设置 数据网关 - 数据移动。有关更多信息,请参阅Qlik 数据网关 - 数据移动。
-
连接到 SaaS 应用程序的第一步是向数据源添加应用程序连接。您可以用几种方法做到这一点。
-
单击列出源连接的创建连接,然后单击应用程序连接。
-
单击顶部栏中的新增,然后单击应用程序连接。
-
-
选择要连接的数据源的类型。
-
填写连接详细信息以验证连接。对于不同的 SaaS 应用程序,连接细节和身份验证过程是不同的。
有关详细信息,请转到连接到 SaaS 应用程序 并选择您的数据源。
选择打开连接元数据,然后在准备好后单击创建。
-
将显示元数据管理器,您可以在其中定义连接的元数据。
单击生成元数据以基于对源数据的采样创建元数据。
有关元数据加载的更多信息,请参阅扫描数据以生成元数据。
-
选择要使用的源数据集,然后单击确定。
-
选择用于扫描数据的选项。您可以执行完全扫描或快速扫描。
全面扫描会更准确,但可能需要很长时间才能处理。如果选择全扫描,则在登陆数据时,该数据将用于初始加载。
您还可以设置默认的元数据设置。
准备好后,单击生成元数据。
元数据生成完成后,您可以在登录或入门任务中使用该连接。
更改处理
您可以使用两种不同的更新方法从 SaaS 应用程序获取数据。更新方法在登陆数据任务的设置中设置。一旦准备好登陆数据任务,就不可能更改更新方法。
-
更改数据捕获 (CDC)
登陆以满负载开始。然后使用基于日期字段的增量加载来保持登陆数据的最新状态。CDC 可能并非所有数据源都支持。
信息注释不支持删除。这意味着,如果在源中删除某行,则不会在平台数据中删除该行。如果删除处理很重要,请改用重新加载并比较。可以在设置 > 运行时下的登陆数据任务中设置从源读取更改之间的间隔。
-
重新加载并比较
平台仅从源执行满负载。如果您的源不支持 CDC,但可以与任何受支持的数据源一起使用,则此选项非常有用。
您可以定期安排重新加载。
限制
变更数据捕获 (CDC) 不支持 SaaS 应用程序返回的某些表。在这种情况下,您将在验证错误中看到一条警告消息。您可以执行以下操作之一:
-
从数据任务中删除表。
-
将数据任务的更新方法更改为重新加载并比较。
管理元数据
创建到数据源的连接时,还需要为包含的数据集定义元数据。元数据在生成模式时用于规范化和定义适当的目标表。元数据允许您选择要在指向目标的复制中使用的列。当从源返回嵌套结构时,输出表将被规范化以保持数据的粒度。
您可以执行以下操作之一:
-
通过对源表中的数据进行采样生成元数据
-
导入从具有相同类型数据源的连接导出的元数据。
通过在数据连接中单击要管理的连接上的元数据,可以管理连接的元数据。
扫描数据以生成元数据
生成元数据时,可以选择对数据执行完全扫描,或在元数据加载中执行快速扫描。
-
全面数据扫描会更准确,但可能需要很长时间才能处理。
-
快速数据扫描基于数据样本。这会更快,但没有那么准确。您可以通过数据样本数选择要在扫描中使用的数据采样数。增加数字以提高准确性。
数据样本中包含的记录数取决于使用的数据源。
您还可以选择如何设置字符串列的大小。
-
固定
将固定字符串列大小设置为介于 1 和 10000 之间。
-
基于数据值
将字符串列大小设置为数据样本中字段的最长观测值,再乘以相乘中的值。
如果字段对样本中所有行都为空,列字符串大小将设置为没有值时的默认大小中的值。
选择数据集
您可以将数据集添加到元数据中。
-
单击选择数据集。
现在,您可以选择要添加到元数据中的数据集。如果数据集已包含在元数据中,则会重新加载该数据集。
在完成操作时,单击确定。
删除数据集
-
要从元数据中删除数据集,请单击数据集上 ... 在,然后单击删除
编辑数据集中的列
您可以编辑数据集中的列,将其设置为键、使其可以为 null 或更改数据类型。
-
选择数据集。
-
选择要编辑的列。
-
单击编辑
删除数据集中的列
-
选择数据集。
-
选择要编辑的列。
-
单击删除。
导出和导入元数据
您可以从一个连接导出元数据,然后将其导入另一个连接。
-
单击导出元数据以导出元数据。
-
单击导入元数据可从导出的元数据文件中添加元数据。元数据文件必须已从相同类型的数据源导出。如果存在具有相同名称的表,则可以在导入时跳过这些表,也可以覆盖现有元数据。
重新加载元数据
当源数据发生结构更改时,必须重新加载连接的元数据。
-
要重新加载所有数据集的元数据,请单击重新加载元数据。
-
要重新加载特定数据集,请单击数据集上的 ...,然后单击重新加载元数据
有关元数据加载的更多信息,请参阅扫描数据以生成元数据。