创建 Hugging Face 连接
要与 Hugging Face 进行通信,请创建与 Hugging Face 分析源的连接。正在Analytics 活动中心的创建页面中创建连接,数据加载编辑器 或脚本 。
从这些连接接收到的数据可以用于加载脚本,还可以用于图表表达式,以增强您的 Qlik Sense 分析应用程序。
配置和可配置设置
使用以下配置之一设置 Hugging Face 分析连接。每个连接都可以由一个配置组成。
Hugging Face 连接器的每个可用配置都对应于您要使用 Hugging Face 平台上可用的模型执行的通用任务。有成千上万的模型可用于帮助处理每项任务。
并非所有 Hugging Face 模型都可与 Qlik Hugging Face 连接器一起使用。模型在 Qlik Sense 中的可用性在一定程度上取决于外部因素。可能会应用其他特定于型号的限制和要求,从而影响连接器的配置和数据交换方式。有关任何特定模型的完整详细信息,请参阅官方 Hugging Face 文档。
Feature Extraction
使用此配置可以使用执行特征提取任务的模型。通常,特征提取是一个技术性的机器学习过程,具有许多实际应用。通过此任务,输入数据被转换为数字特征。
有关详细信息,请参阅以下 Hugging Face 资源:
-
特征提取任务概述:Feature Extraction
字段 | 说明 |
---|---|
Configuration | 选择连接器配置。对于用于特征提取任务的模型,请选择Feature Extraction。 |
Hugging Face Inference API endpoint | 输入 Qlik Sense 可以访问模型的端点 URL。这通常是通过 Hugging Face Inference API 完成的。 |
Hugging Face API Token | 输入您在创建帐户后生成的 Hugging Face API 令牌。这将验证您的帐户凭据,以便您可以使用外部服务。参阅生成 API 令牌。 |
Use Cache |
默认情况下,此选项设置为 True。如果两次发出相同的请求,请选择是否使用缓存来重用模型响应。根据您的型号,您可能需要关闭此设置。 |
Wait For Model |
默认情况下,此选项设置为 False。如果启用此选项,则可以通过在发出请求之前等待模型准备就绪来减少向 API 发出的请求数量。 |
Association Field |
指定关联字段,该字段来自包含唯一标识符的输入数据表。这是一个可选参数。 当对使用密钥对返回的与源字段表相关联的结果表发出端点请求时,需要在源数据中包含该字段。指定的字段将作为字段返回到响应中,并使响应能够与数据模型中的源数据相关联。这可以是任何具有惟一 ID 的字段,可以来自源数据,也可以作为表加载过程的一部分。 |
Name | 连接的名称。如果不输入名称,则使用默认名称。 |
Question Answering
使用此配置可以使用执行问答任务的模型。对于问答,给定单独提供的上下文片段,可以使用模型来提取问题的答案。在 Qlik Sense 中,问题和上下文都在应用程序或脚本数据中提供。
有关详细信息,请参阅以下 Hugging Face 资源:
-
问答任务概述:Question Answering
字段 | 说明 |
---|---|
Configuration | 选择连接器配置。对于问答任务中使用的模型,请选择Question Answering。 |
Hugging Face Inference API endpoint | 输入 Qlik Sense 可以访问模型的端点 URL。这通常是通过 Hugging Face Inference API 完成的。 |
Hugging Face API Token | 输入您在创建帐户后生成的 Hugging Face API 令牌。这将验证您的帐户凭据,以便您可以使用外部服务。参阅生成 API 令牌。 |
Use Cache |
默认情况下,此选项设置为 True。如果两次发出相同的请求,请选择是否使用缓存来重用模型响应。根据您的型号,您可能需要关闭此设置。 |
Wait For Model |
默认情况下,此选项设置为 False。如果启用此选项,则可以通过在发出请求之前等待模型准备就绪来减少向 API 发出的请求数量。 |
Association Field |
指定关联字段,该字段来自包含唯一标识符的输入数据表。这是一个可选参数。 当对使用密钥对返回的与源字段表相关联的结果表发出端点请求时,需要在源数据中包含该字段。指定的字段将作为字段返回到响应中,并使响应能够与数据模型中的源数据相关联。这可以是任何具有惟一 ID 的字段,可以来自源数据,也可以作为表加载过程的一部分。 |
Name | 连接的名称。如果不输入名称,则使用默认名称。 |
Summarization
使用此配置可以使用执行摘要任务的模型。模型通过获取特定的输入文本并输出该文本的简短摘要来执行摘要,同时保留基本细节。
有关详细信息,请参阅以下 Hugging Face 资源:
-
摘要任务概述:Summarization
字段 | 说明 |
---|---|
Configuration | 选择连接器配置。对于摘要任务中使用的模型,请选择Summarization。 |
Hugging Face Inference API endpoint | 输入 Qlik Sense 可以访问模型的端点 URL。这通常是通过 Hugging Face Inference API 完成的。 |
Hugging Face API Token | 输入您在创建帐户后生成的 Hugging Face API 令牌。这将验证您的帐户凭据,以便您可以使用外部服务。参阅生成 API 令牌。 |
Minimum Token Length | 将整数值设置为要在模型输出中使用的最小令牌数。可选参数。如果未指定任何值,则输出将没有最小长度。 |
Maximum Token Length | 将整数值设置为要在模型输出中使用的最大令牌数。可选参数。如果未指定任何值,则输出将没有最大长度。 |
Top K | 将整数值设置为要在输出中使用的最可能的标记数。可选参数。如果未指定任何值,则输出将不会有在输出中使用的最可能的令牌的最大数量。 |
Top P |
输入一个数字(特别是浮点),以控制输出的随机性(根据令牌概率)。有关完整详细信息,请参阅 Hugging Face 文档。 可选参数。如果未指定任何值,则输出将不会按您的选择控制随机性。 |
Temperature | 指定一个浮点值(介于 0.00 和 100.0 之间)以控制输出的随机性。较高的值通常会导致更高的令牌随机性。默认值为 1.0。可选参数。 |
Repetition Penalty | 指定一个浮点值(介于 0.00 和 100.0 之间),以对重复的令牌强制执行惩罚。默认值为 1.0。可选参数。 |
Maximum Query Time | 指定一个浮点值(介于 0 和 120.0 之间),表示查询所用的最长时间(以秒为单位)。这是一个软性限制。可选参数。如果未指定任何值,则不会设置最长查询时间。 |
Use Cache |
默认情况下,此选项设置为 True。如果两次发出相同的请求,请选择是否使用缓存来重用模型响应。根据您的型号,您可能需要关闭此设置。 |
Wait For Model |
默认情况下,此选项设置为 False。如果启用此选项,则可以通过在发出请求之前等待模型准备就绪来减少向 API 发出的请求数量。 |
Association Field |
指定关联字段,该字段来自包含唯一标识符的输入数据表。这是一个可选参数。 当对使用密钥对返回的与源字段表相关联的结果表发出端点请求时,需要在源数据中包含该字段。指定的字段将作为字段返回到响应中,并使响应能够与数据模型中的源数据相关联。这可以是任何具有惟一 ID 的字段,可以来自源数据,也可以作为表加载过程的一部分。 |
Name | 连接的名称。如果不输入名称,则使用默认名称。 |
Sentence Similarity
使用此配置可以使用执行句子相似性分析的模型。在这种任务类型中,模型将一个或多个不同的句子与源句子进行比较,产生存储关于它们之间相似性的信息的嵌入。这些嵌入是数值。利用嵌入是一个先进的机器学习过程。
在 Qlik Sense 中,源语句在连接器配置中提供,输入语句(模型将其与源语句进行比较)在应用程序或脚本数据中提供。
有关详细信息,请参阅以下 Hugging Face 资源:
-
句子相似性任务概述:Sentence Similarity
字段 | 说明 |
---|---|
Configuration | 选择连接器配置。对于与句子相似性分析相关的任务中使用的模型,请选择Sentence Similarity。 |
Hugging Face Inference API endpoint | 输入 Qlik Sense 可以访问模型的端点 URL。这通常是通过 Hugging Face Inference API 完成的。 |
Hugging Face API Token | 输入您在创建帐户后生成的 Hugging Face API 令牌。这将验证您的帐户凭据,以便您可以使用外部服务。参阅生成 API 令牌。 |
Source Sentence |
模型将文本字符串与每个输入数据项进行比较,以评估两个字符串之间的相似性。 |
Use Cache |
默认情况下,此选项设置为 True。如果两次发出相同的请求,请选择是否使用缓存来重用模型响应。根据您的型号,您可能需要关闭此设置。 |
Wait For Model |
默认情况下,此选项设置为 False。如果启用此选项,则可以通过在发出请求之前等待模型准备就绪来减少向 API 发出的请求数量。 |
Association Field |
指定关联字段,该字段来自包含唯一标识符的输入数据表。这是一个可选参数。 当对使用密钥对返回的与源字段表相关联的结果表发出端点请求时,需要在源数据中包含该字段。指定的字段将作为字段返回到响应中,并使响应能够与数据模型中的源数据相关联。这可以是任何具有惟一 ID 的字段,可以来自源数据,也可以作为表加载过程的一部分。 |
Name | 连接的名称。如果不输入名称,则使用默认名称。 |
Text Classification
使用此配置可以使用执行文本分类任务的模型。文本分类是一种通用的任务类型,其中模型可以执行情感分析、语法正确性检查和其他语言处理操作。
有关详细信息,请参阅以下 Hugging Face 资源:
-
文本分类任务概述:Text Classification
字段 | 说明 |
---|---|
Configuration | 选择连接器配置。对于文本分类任务中使用的模型,请选择Text Classification。 |
Hugging Face Inference API endpoint | 输入 Qlik Sense 可以访问模型的端点 URL。这通常是通过 Hugging Face Inference API 完成的。 |
Hugging Face API Token | 输入您在创建帐户后生成的 Hugging Face API 令牌。这将验证您的帐户凭据,以便您可以使用外部服务。参阅生成 API 令牌。 |
Use Cache |
默认情况下,此选项设置为 True。如果两次发出相同的请求,请选择是否使用缓存来重用模型响应。根据您的型号,您可能需要关闭此设置。 |
Wait For Model |
默认情况下,此选项设置为 False。如果启用此选项,则可以通过在发出请求之前等待模型准备就绪来减少向 API 发出的请求数量。 |
Association Field |
指定关联字段,该字段来自包含唯一标识符的输入数据表。这是一个可选参数。 当对使用密钥对返回的与源字段表相关联的结果表发出端点请求时,需要在源数据中包含该字段。指定的字段将作为字段返回到响应中,并使响应能够与数据模型中的源数据相关联。这可以是任何具有惟一 ID 的字段,可以来自源数据,也可以作为表加载过程的一部分。 |
Name | 连接的名称。如果不输入名称,则使用默认名称。 |
Text Generation
使用此配置可以使用执行文本生成任务的模型。使用此任务类型的模型通常可以完成不完整的文本段,或执行文本的转述。
有关详细信息,请参阅以下 Hugging Face 资源:
-
文本生成任务概述:Text Generation
字段 | 说明 |
---|---|
Configuration | 选择连接器配置。对于文本生成任务中使用的模型,请选择Text Generation。 |
Hugging Face Inference API endpoint | 输入 Qlik Sense 可以访问模型的端点 URL。这通常是通过 Hugging Face Inference API 完成的。 |
Hugging Face API Token | 输入您在创建帐户后生成的 Hugging Face API 令牌。这将验证您的帐户凭据,以便您可以使用外部服务。参阅生成 API 令牌。 |
Maximum Token Length | 将整数值设置为要在模型输出中使用的最大令牌数。可选参数。如果未指定任何值,则输出将没有最大长度。 |
Top K | 将整数值设置为要在输出中使用的最可能的标记数。可选参数。如果未指定任何值,则输出将不会有在输出中使用的最可能的令牌的最大数量。 |
Top P |
输入一个数字(特别是浮点),以控制输出的随机性(根据令牌概率)。有关完整详细信息,请参阅 Hugging Face 文档。 可选参数。如果未指定任何值,则输出将不会按您的选择控制随机性。 |
Temperature | 指定一个浮点值(介于 0.00 和 100.0 之间)以控制输出的随机性。较高的值通常会导致更高的令牌随机性。默认值为 1.0。可选参数。 |
Repetition Penalty | 指定一个浮点值(介于 0.00 和 100.0 之间),以对重复的令牌强制执行惩罚。默认值为 1.0。可选参数。 |
Maximum Query Time | 指定一个浮点值(介于 0 和 120.0 之间),表示查询所用的最长时间(以秒为单位)。这是一个软性限制。可选参数。如果未指定任何值,则不会设置最长查询时间。 |
Use Cache |
默认情况下,此选项设置为 True。如果两次发出相同的请求,请选择是否使用缓存来重用模型响应。根据您的型号,您可能需要关闭此设置。 |
Wait For Model |
默认情况下,此选项设置为 False。如果启用此选项,则可以通过在发出请求之前等待模型准备就绪来减少向 API 发出的请求数量。 |
Association Field |
指定关联字段,该字段来自包含唯一标识符的输入数据表。这是一个可选参数。 当对使用密钥对返回的与源字段表相关联的结果表发出端点请求时,需要在源数据中包含该字段。指定的字段将作为字段返回到响应中,并使响应能够与数据模型中的源数据相关联。这可以是任何具有惟一 ID 的字段,可以来自源数据,也可以作为表加载过程的一部分。 |
Name | 连接的名称。如果不输入名称,则使用默认名称。 |
Token Classification
使用此配置可以使用执行令牌分类任务的模型。通过令牌分类,模型可以将文本字符串(标记)识别为可分类的实体(例如,地点、人和词性)。
有关详细信息,请参阅以下 Hugging Face 资源:
-
令牌分类任务概述:Token Classification
字段 | 说明 |
---|---|
Configuration | 选择连接器配置。对于令牌分类任务中使用的模型,请选择Token Classification。 |
Hugging Face Inference API endpoint | 输入 Qlik Sense 可以访问模型的端点 URL。这通常是通过 Hugging Face Inference API 完成的。 |
Hugging Face API Token | 输入您在创建帐户后生成的 Hugging Face API 令牌。这将验证您的帐户凭据,以便您可以使用外部服务。参阅生成 API 令牌。 |
Aggregation Strategy |
输入中实体的分类可以进行聚合处理。此参数指定进行分类时应用的聚合策略的类型。 从以下选项中进行选择:
Simple 是默认选项。 |
Use Cache |
默认情况下,此选项设置为 True。如果两次发出相同的请求,请选择是否使用缓存来重用模型响应。根据您的型号,您可能需要关闭此设置。 |
Wait For Model |
默认情况下,此选项设置为 False。如果启用此选项,则可以通过在发出请求之前等待模型准备就绪来减少向 API 发出的请求数量。 |
Association Field |
指定关联字段,该字段来自包含唯一标识符的输入数据表。这是一个可选参数。 当对使用密钥对返回的与源字段表相关联的结果表发出端点请求时,需要在源数据中包含该字段。指定的字段将作为字段返回到响应中,并使响应能够与数据模型中的源数据相关联。这可以是任何具有惟一 ID 的字段,可以来自源数据,也可以作为表加载过程的一部分。 |
Name | 连接的名称。如果不输入名称,则使用默认名称。 |
Translation
使用此配置可以使用执行翻译任务的模型。模型可以将某种语言的输入文本翻译成另一种语言。
有关详细信息,请参阅以下 Hugging Face 资源:
-
翻译任务概述:Translation
字段 | 说明 |
---|---|
Configuration | 选择连接器配置。对于翻译任务中使用的模型,请选择Translation。 |
Hugging Face Inference API endpoint | 输入 Qlik Sense 可以访问模型的端点 URL。这通常是通过 Hugging Face Inference API 完成的。 |
Hugging Face API Token | 输入您在创建帐户后生成的 Hugging Face API 令牌。这将验证您的帐户凭据,以便您可以使用外部服务。参阅生成 API 令牌。 |
Source Language |
输入您要求翻译的输入文本的语言。可选参数。 信息注释每个模型提供的语言翻译能力可能各不相同。例如,可以将模型设计为仅在两种特定语言之间翻译文本。在这种情况下,将此参数留空是有意义的。
|
Target Language |
输入将翻译的文本的目标语言。可选参数。 信息注释每个模型提供的语言翻译能力可能各不相同。例如,可以将模型设计为仅在两种特定语言之间翻译文本。在这种情况下,将此参数留空是有意义的。
|
Use Cache |
默认情况下,此选项设置为 True。如果两次发出相同的请求,请选择是否使用缓存来重用模型响应。根据您的型号,您可能需要关闭此设置。 |
Wait For Model |
默认情况下,此选项设置为 False。如果启用此选项,则可以通过在发出请求之前等待模型准备就绪来减少向 API 发出的请求数量。 |
Association Field |
指定关联字段,该字段来自包含唯一标识符的输入数据表。这是一个可选参数。 当对使用密钥对返回的与源字段表相关联的结果表发出端点请求时,需要在源数据中包含该字段。指定的字段将作为字段返回到响应中,并使响应能够与数据模型中的源数据相关联。这可以是任何具有惟一 ID 的字段,可以来自源数据,也可以作为表加载过程的一部分。 |
Name | 连接的名称。如果不输入名称,则使用默认名称。 |
创建新连接
您可以从 Analytics 活动中心、现有应用程序中的 数据加载编辑器 或现有脚本中的 脚本 创建到分析连接器的连接。按照以下步骤创建连接。
执行以下操作:
-
通过数据加载编辑器或 脚本 访问连接器。
-
单击创建新连接。
-
在空间下,选择连接所在的空间。
-
从数据连接器列表中选择 Hugging Face。
-
填写连接对话框字段。
-
单击创建。
数据连接保存到创建应用程序的空间中,因此可以在其他 Qlik Sense 应用程序和脚本中重复使用。它也列在 数据加载编辑器 或 脚本 中的数据连接下。
一旦创建了连接,就可以使用它加载带有请求和平台对请求的响应的数据。此外,您还可以在图表表达式中使用它。有关更多信息,请参阅从 Hugging Face 连接选择并加载数据和在可视化表达式中使用 Hugging Face 连接。