连接到 SaaS 应用程序
您可以在 Qlik Talend Data Integration 中登陆或复制来自大量 SaaS 应用程序的数据。
![](https://play.vidyard.com/m7R8rXnVKBtpCwPNqiM6Er.jpg)
要查看所有支持的应用程序,请转到Supported SaaS applications。
为了快速开发用于不断增长的云应用程序源的连接器,Qlik 正在创建用于使用标准 API 和生成式 AI 技术的 Qlik Talend Data Integration 的应用程序连接器。
为了加速新 SaaS 应用程序连接器的可用性,我们将首先为特定用例开发一些连接器,然后用 Lite 标签发布它们或用 标记。有关更多信息,请参阅SaaS 应用程序连接器的分类。
连接到 SaaS 应用程序
连接到 SaaS 应用程序可能需要您设置 数据移动网关,具体取决于您的用例。有关更多信息,请参阅什么时候需要 数据移动网关?。
-
连接到 SaaS 应用程序的第一步是向数据源添加连接。您可以用几种方法做到这一点。
-
在连接中单击创建连接。
-
单击创建连接,由此可列出源连接(例如,在数据任务设置向导中)。
选择类别中的应用程序以过滤 SaaS 应用程序连接器的连接器列表。
也可以从最近使用的连接器中进行选择。
-
-
选择要连接到的应用程序。
-
填写连接详细信息以验证连接。对于不同的 SaaS 应用程序,连接细节和身份验证过程是不同的。
有关更多信息,请转到连接到 SaaS 应用程序 并选择您的数据源。
选择打开连接元数据,然后在准备好后单击创建。
-
将显示元数据管理器,您可以在其中定义连接的元数据。
单击生成元数据以基于对源数据的采样创建元数据。
有关元数据加载的更多信息,请参阅扫描数据以生成元数据。
-
选择要使用的源数据集,然后单击确定。
-
选择用于扫描数据的选项。您可以执行完全扫描或快速扫描。
全面扫描会更准确,但可能需要很长时间才能处理。如果选择全扫描,则在登陆数据时,该数据将用于初始加载。
您还可以设置默认的元数据设置。
准备好后,单击生成元数据。
元数据生成完成后,您可以在登录或入门任务中使用该连接。
管理元数据
创建到数据源的连接时,还需要为包含的数据集定义元数据。元数据在生成模式时用于规范化和定义适当的目标表。元数据允许您选择要在指向目标的复制中使用的列。当从源返回嵌套结构时,输出表将被规范化以保持数据的粒度。
您可以执行以下操作之一:
-
通过对源表中的数据进行采样生成元数据
-
导入从具有相同类型数据源的连接导出的元数据。
通过在连接中单击要管理的连接上的元数据,可以管理连接的元数据。
扫描数据以生成元数据
生成元数据时,可以选择对数据执行完全扫描,或在元数据加载中执行快速扫描。
-
全面数据扫描会更准确,但可能需要很长时间才能处理。
-
快速数据扫描基于数据样本。这会更快,但没有那么准确。您可以通过数据样本数选择要在扫描中使用的数据采样数。增加数字以提高准确性。
数据样本中包含的记录数取决于使用的数据源。
您还可以选择如何设置字符串列的大小。
-
固定
将固定字符串列大小设置为介于 1 和 10000 之间。
-
基于数据值
将字符串列大小设置为数据样本中字段的最长观测值,再乘以相乘中的值。
如果字段对样本中所有行都为空,列字符串大小将设置为没有值时的默认大小中的值。
选择数据集
您可以将数据集添加到元数据中。
-
单击选择数据集。
现在,您可以选择要添加到元数据中的数据集。如果数据集已包含在元数据中,则会重新加载该数据集。
在完成操作时,单击确定。
删除数据集
-
要从元数据中删除数据集,请单击数据集上 ... 在,然后单击删除
编辑数据集中的列
您可以编辑数据集中的列,将其设置为键、使其可以为 null 或更改数据类型。
-
选择数据集。
-
选择要编辑的列。
-
单击编辑
删除数据集中的列
-
选择数据集。
-
选择要编辑的列。
-
单击删除。
导出和导入元数据
您可以从一个连接导出元数据,然后将其导入另一个连接。
-
单击导出元数据以导出元数据。
-
单击导入元数据可从导出的元数据文件中添加元数据。元数据文件必须已从相同类型的数据源导出。如果存在具有相同名称的表,则可以在导入时跳过这些表,也可以覆盖现有元数据。
重新加载元数据
当源数据发生结构更改时,必须重新加载连接的元数据。
-
要重新加载所有数据集的元数据,请单击重新加载元数据。
-
要重新加载特定数据集,请单击数据集上的 ...,然后单击重新加载元数据
有关元数据加载的更多信息,请参阅扫描数据以生成元数据。