连接到 SaaS 应用程序
您可以在 Qlik Talend Data Integration 中登陆或复制来自大量 SaaS 应用程序的数据。
要查看所有支持的应用程序,请转到Supported SaaS applications。
为了快速开发用于不断增长的云应用程序源的连接器,Qlik 正在创建用于使用标准 API 和生成式 AI 技术的 Qlik Talend Data Integration 的应用程序连接器。
为了加速新 SaaS 应用程序连接器的可用性,我们将首先为特定用例开发一些连接器,然后用 Lite 标签发布它们或用 标记。有关更多信息,请参阅SaaS 应用程序连接器的分类。
连接到 SaaS 应用程序
连接到 SaaS 应用程序可能需要您设置 数据移动网关,具体取决于您的用例。有关更多信息,请参阅什么时候需要 数据移动网关?。
-
连接到 SaaS 应用程序的第一步是向数据源添加连接。您可以用几种方法做到这一点。
-
在连接中单击创建连接。
-
单击创建连接,由此可列出源连接(例如,在数据任务设置向导中)。
选择类别中的应用程序以过滤 SaaS 应用程序连接器的连接器列表。
也可以从最近使用的连接器中进行选择。
-
-
选择要连接到的应用程序。
-
填写连接详细信息以验证连接。对于不同的 SaaS 应用程序,连接细节和身份验证过程是不同的。
有关更多信息,请转到连接到 SaaS 应用程序 并选择您的数据源。
选择打开连接元数据,然后在准备好后单击创建。
-
将显示元数据管理器,您可以在其中定义连接的元数据。
单击生成元数据以基于对源数据的采样创建元数据。
有关元数据加载的更多信息,请参阅扫描数据以生成元数据。
-
选择要使用的源数据集,然后单击确定。
-
选择用于扫描数据的选项。您可以执行完全扫描或快速扫描。
全面扫描会更准确,但可能需要很长时间才能处理。如果选择全扫描,则在登陆数据时,该数据将用于初始加载。
您还可以设置默认的元数据设置。
准备好后,单击生成元数据。
元数据生成完成后,您可以在登录或入门任务中使用该连接。
管理元数据
创建到数据源的连接时,还需要为包含的数据集定义元数据。元数据在生成模式时用于规范化和定义适当的目标表。元数据允许您选择要在指向目标的复制中使用的列。当从源返回嵌套结构时,输出表将被规范化以保持数据的粒度。
您可以执行以下操作之一:
-
通过对源表中的数据进行采样生成元数据
-
导入从具有相同类型数据源的连接导出的元数据。
通过在连接中单击要管理的连接上的元数据,可以管理连接的元数据。
扫描数据以生成元数据
生成元数据时,可以选择对数据执行完全扫描,或在元数据加载中执行快速扫描。
-
全面数据扫描会更准确,但可能需要很长时间才能处理。
-
快速数据扫描基于数据样本。这会更快,但没有那么准确。您可以通过数据样本数选择要在扫描中使用的数据采样数。增加数字以提高准确性。
数据样本中包含的记录数取决于使用的数据源。
您还可以选择如何设置字符串列的大小。
-
固定
将固定字符串列大小设置为介于 1 和 10000 之间。
-
基于数据值
将字符串列大小设置为数据样本中字段的最长观测值,再乘以相乘中的值。
如果字段对样本中所有行都为空,列字符串大小将设置为没有值时的默认大小中的值。
选择数据集
您可以将数据集添加到元数据中。
-
单击选择数据集。
现在,您可以选择要添加到元数据中的数据集。如果数据集已包含在元数据中,则会重新加载该数据集。
在完成操作时,单击确定。
删除数据集
-
要从元数据中删除数据集,请单击数据集上 ... 在,然后单击删除
编辑数据集中的列
您可以编辑数据集中的列,将其设置为键、使其可以为 null 或更改数据类型。
-
选择数据集。
-
选择要编辑的列。
-
单击编辑
删除数据集中的列
-
选择数据集。
-
选择要编辑的列。
-
单击删除。
导出和导入元数据
您可以从一个连接导出元数据,然后将其导入另一个连接。
-
单击导出元数据以导出元数据。
-
单击导入元数据可从导出的元数据文件中添加元数据。元数据文件必须已从相同类型的数据源导出。如果存在具有相同名称的表,则可以在导入时跳过这些表,也可以覆盖现有元数据。
重新加载元数据
当源数据发生结构更改时,必须重新加载连接的元数据。
-
要重新加载所有数据集的元数据,请单击重新加载元数据。
-
要重新加载特定数据集,请单击数据集上的 ...,然后单击重新加载元数据
有关元数据加载的更多信息,请参阅扫描数据以生成元数据。