跳到主要内容 跳到补充内容

创建 Hugging Face 连接

要与 Hugging Face 进行通信,请创建与 Hugging Face 分析源的连接。正在Analytics 活动中心的创建页面中创建连接数据加载编辑器脚本

从这些连接接收到的数据可以用于加载脚本,还可以用于图表表达式,以增强您的 Qlik Sense 分析应用程序。

配置和可配置设置

使用以下配置之一设置 Hugging Face 分析连接。每个连接都可以由一个配置组成。

Hugging Face 连接器的每个可用配置都对应于您要使用 Hugging Face 平台上可用的模型执行的通用任务。有成千上万的模型可用于帮助处理每项任务。

并非所有 Hugging Face 模型都可与 Qlik Hugging Face 连接器一起使用。模型在 Qlik Sense 中的可用性在一定程度上取决于外部因素。可能会应用其他特定于型号的限制和要求,从而影响连接器的配置和数据交换方式。有关任何特定模型的完整详细信息,请参阅官方 Hugging Face 文档。

Tasks

Models

Feature Extraction

使用此配置可以使用执行特征提取任务的模型。通常,特征提取是一个技术性的机器学习过程,具有许多实际应用。通过此任务,输入数据被转换为数字特征。

有关详细信息,请参阅以下 Hugging Face 资源:

Feature Extraction 配置的可配置设置
字段 说明
Configuration 选择连接器配置。对于用于特征提取任务的模型,请选择Feature Extraction
Hugging Face Inference API endpoint 输入 Qlik Sense 可以访问模型的端点 URL。这通常是通过 Hugging Face Inference API 完成的。
Hugging Face API Token 输入您在创建帐户后生成的 Hugging Face API 令牌。这将验证您的帐户凭据,以便您可以使用外部服务。参阅生成 API 令牌
Use Cache

默认情况下,此选项设置为 True。如果两次发出相同的请求,请选择是否使用缓存来重用模型响应。根据您的型号,您可能需要关闭此设置。

Wait For Model

默认情况下,此选项设置为 False。如果启用此选项,则可以通过在发出请求之前等待模型准备就绪来减少向 API 发出的请求数量。

Association Field

指定关联字段,该字段来自包含唯一标识符的输入数据表。这是一个可选参数。

当对使用密钥对返回的与源字段表相关联的结果表发出端点请求时,需要在源数据中包含该字段。指定的字段将作为字段返回到响应中,并使响应能够与数据模型中的源数据相关联。这可以是任何具有惟一 ID 的字段,可以来自源数据,也可以作为表加载过程的一部分。

Name 连接的名称。如果不输入名称,则使用默认名称。

Question Answering

使用此配置可以使用执行问答任务的模型。对于问答,给定单独提供的上下文片段,可以使用模型来提取问题的答案。在 Qlik Sense 中,问题和上下文都在应用程序或脚本数据中提供。

有关详细信息,请参阅以下 Hugging Face 资源:

Question Answering 配置的可配置设置
字段 说明
Configuration 选择连接器配置。对于问答任务中使用的模型,请选择Question Answering
Hugging Face Inference API endpoint 输入 Qlik Sense 可以访问模型的端点 URL。这通常是通过 Hugging Face Inference API 完成的。
Hugging Face API Token 输入您在创建帐户后生成的 Hugging Face API 令牌。这将验证您的帐户凭据,以便您可以使用外部服务。参阅生成 API 令牌
Use Cache

默认情况下,此选项设置为 True。如果两次发出相同的请求,请选择是否使用缓存来重用模型响应。根据您的型号,您可能需要关闭此设置。

Wait For Model

默认情况下,此选项设置为 False。如果启用此选项,则可以通过在发出请求之前等待模型准备就绪来减少向 API 发出的请求数量。

Association Field

指定关联字段,该字段来自包含唯一标识符的输入数据表。这是一个可选参数。

当对使用密钥对返回的与源字段表相关联的结果表发出端点请求时,需要在源数据中包含该字段。指定的字段将作为字段返回到响应中,并使响应能够与数据模型中的源数据相关联。这可以是任何具有惟一 ID 的字段,可以来自源数据,也可以作为表加载过程的一部分。

Name 连接的名称。如果不输入名称,则使用默认名称。

Summarization

使用此配置可以使用执行摘要任务的模型。模型通过获取特定的输入文本并输出该文本的简短摘要来执行摘要,同时保留基本细节。

有关详细信息,请参阅以下 Hugging Face 资源:

Summarization 配置的可配置设置
字段 说明
Configuration 选择连接器配置。对于摘要任务中使用的模型,请选择Summarization
Hugging Face Inference API endpoint 输入 Qlik Sense 可以访问模型的端点 URL。这通常是通过 Hugging Face Inference API 完成的。
Hugging Face API Token 输入您在创建帐户后生成的 Hugging Face API 令牌。这将验证您的帐户凭据,以便您可以使用外部服务。参阅生成 API 令牌
Minimum Token Length 将整数值设置为要在模型输出中使用的最小令牌数。可选参数。如果未指定任何值,则输出将没有最小长度。
Maximum Token Length 将整数值设置为要在模型输出中使用的最大令牌数。可选参数。如果未指定任何值,则输出将没有最大长度。
Top K 将整数值设置为要在输出中使用的最可能的标记数。可选参数。如果未指定任何值,则输出将不会有在输出中使用的最可能的令牌的最大数量。
Top P

输入一个数字(特别是浮点),以控制输出的随机性(根据令牌概率)。有关完整详细信息,请参阅 Hugging Face 文档。

可选参数。如果未指定任何值,则输出将不会按您的选择控制随机性。

Temperature 指定一个浮点值(介于 0.00 和 100.0 之间)以控制输出的随机性。较高的值通常会导致更高的令牌随机性。默认值为 1.0。可选参数。
Repetition Penalty 指定一个浮点值(介于 0.00 和 100.0 之间),以对重复的令牌强制执行惩罚。默认值为 1.0。可选参数。
Maximum Query Time 指定一个浮点值(介于 0 和 120.0 之间),表示查询所用的最长时间(以秒为单位)。这是一个软性限制。可选参数。如果未指定任何值,则不会设置最长查询时间。
Use Cache

默认情况下,此选项设置为 True。如果两次发出相同的请求,请选择是否使用缓存来重用模型响应。根据您的型号,您可能需要关闭此设置。

Wait For Model

默认情况下,此选项设置为 False。如果启用此选项,则可以通过在发出请求之前等待模型准备就绪来减少向 API 发出的请求数量。

Association Field

指定关联字段,该字段来自包含唯一标识符的输入数据表。这是一个可选参数。

当对使用密钥对返回的与源字段表相关联的结果表发出端点请求时,需要在源数据中包含该字段。指定的字段将作为字段返回到响应中,并使响应能够与数据模型中的源数据相关联。这可以是任何具有惟一 ID 的字段,可以来自源数据,也可以作为表加载过程的一部分。

Name 连接的名称。如果不输入名称,则使用默认名称。

Sentence Similarity

使用此配置可以使用执行句子相似性分析的模型。在这种任务类型中,模型将一个或多个不同的句子与源句子进行比较,产生存储关于它们之间相似性的信息的嵌入。这些嵌入是数值。利用嵌入是一个先进的机器学习过程。

Qlik Sense 中,源语句在连接器配置中提供,输入语句(模型将其与源语句进行比较)在应用程序或脚本数据中提供。

有关详细信息,请参阅以下 Hugging Face 资源:

Sentence Similarity 配置的可配置设置
字段 说明
Configuration 选择连接器配置。对于与句子相似性分析相关的任务中使用的模型,请选择Sentence Similarity
Hugging Face Inference API endpoint 输入 Qlik Sense 可以访问模型的端点 URL。这通常是通过 Hugging Face Inference API 完成的。
Hugging Face API Token 输入您在创建帐户后生成的 Hugging Face API 令牌。这将验证您的帐户凭据,以便您可以使用外部服务。参阅生成 API 令牌
Source Sentence

模型将文本字符串与每个输入数据项进行比较,以评估两个字符串之间的相似性。

Use Cache

默认情况下,此选项设置为 True。如果两次发出相同的请求,请选择是否使用缓存来重用模型响应。根据您的型号,您可能需要关闭此设置。

Wait For Model

默认情况下,此选项设置为 False。如果启用此选项,则可以通过在发出请求之前等待模型准备就绪来减少向 API 发出的请求数量。

Association Field

指定关联字段,该字段来自包含唯一标识符的输入数据表。这是一个可选参数。

当对使用密钥对返回的与源字段表相关联的结果表发出端点请求时,需要在源数据中包含该字段。指定的字段将作为字段返回到响应中,并使响应能够与数据模型中的源数据相关联。这可以是任何具有惟一 ID 的字段,可以来自源数据,也可以作为表加载过程的一部分。

Name 连接的名称。如果不输入名称,则使用默认名称。

Text Classification

使用此配置可以使用执行文本分类任务的模型。文本分类是一种通用的任务类型,其中模型可以执行情感分析、语法正确性检查和其他语言处理操作。

有关详细信息,请参阅以下 Hugging Face 资源:

Text Classification 配置的可配置设置
字段 说明
Configuration 选择连接器配置。对于文本分类任务中使用的模型,请选择Text Classification
Hugging Face Inference API endpoint 输入 Qlik Sense 可以访问模型的端点 URL。这通常是通过 Hugging Face Inference API 完成的。
Hugging Face API Token 输入您在创建帐户后生成的 Hugging Face API 令牌。这将验证您的帐户凭据,以便您可以使用外部服务。参阅生成 API 令牌
Use Cache

默认情况下,此选项设置为 True。如果两次发出相同的请求,请选择是否使用缓存来重用模型响应。根据您的型号,您可能需要关闭此设置。

Wait For Model

默认情况下,此选项设置为 False。如果启用此选项,则可以通过在发出请求之前等待模型准备就绪来减少向 API 发出的请求数量。

Association Field

指定关联字段,该字段来自包含唯一标识符的输入数据表。这是一个可选参数。

当对使用密钥对返回的与源字段表相关联的结果表发出端点请求时,需要在源数据中包含该字段。指定的字段将作为字段返回到响应中,并使响应能够与数据模型中的源数据相关联。这可以是任何具有惟一 ID 的字段,可以来自源数据,也可以作为表加载过程的一部分。

Name 连接的名称。如果不输入名称,则使用默认名称。

Text Generation

使用此配置可以使用执行文本生成任务的模型。使用此任务类型的模型通常可以完成不完整的文本段,或执行文本的转述。

有关详细信息,请参阅以下 Hugging Face 资源:

Text Generation 配置的可配置设置
字段 说明
Configuration 选择连接器配置。对于文本生成任务中使用的模型,请选择Text Generation
Hugging Face Inference API endpoint 输入 Qlik Sense 可以访问模型的端点 URL。这通常是通过 Hugging Face Inference API 完成的。
Hugging Face API Token 输入您在创建帐户后生成的 Hugging Face API 令牌。这将验证您的帐户凭据,以便您可以使用外部服务。参阅生成 API 令牌
Maximum Token Length 将整数值设置为要在模型输出中使用的最大令牌数。可选参数。如果未指定任何值,则输出将没有最大长度。
Top K 将整数值设置为要在输出中使用的最可能的标记数。可选参数。如果未指定任何值,则输出将不会有在输出中使用的最可能的令牌的最大数量。
Top P

输入一个数字(特别是浮点),以控制输出的随机性(根据令牌概率)。有关完整详细信息,请参阅 Hugging Face 文档。

可选参数。如果未指定任何值,则输出将不会按您的选择控制随机性。

Temperature 指定一个浮点值(介于 0.00 和 100.0 之间)以控制输出的随机性。较高的值通常会导致更高的令牌随机性。默认值为 1.0。可选参数。
Repetition Penalty 指定一个浮点值(介于 0.00 和 100.0 之间),以对重复的令牌强制执行惩罚。默认值为 1.0。可选参数。
Maximum Query Time 指定一个浮点值(介于 0 和 120.0 之间),表示查询所用的最长时间(以秒为单位)。这是一个软性限制。可选参数。如果未指定任何值,则不会设置最长查询时间。
Use Cache

默认情况下,此选项设置为 True。如果两次发出相同的请求,请选择是否使用缓存来重用模型响应。根据您的型号,您可能需要关闭此设置。

Wait For Model

默认情况下,此选项设置为 False。如果启用此选项,则可以通过在发出请求之前等待模型准备就绪来减少向 API 发出的请求数量。

Association Field

指定关联字段,该字段来自包含唯一标识符的输入数据表。这是一个可选参数。

当对使用密钥对返回的与源字段表相关联的结果表发出端点请求时,需要在源数据中包含该字段。指定的字段将作为字段返回到响应中,并使响应能够与数据模型中的源数据相关联。这可以是任何具有惟一 ID 的字段,可以来自源数据,也可以作为表加载过程的一部分。

Name 连接的名称。如果不输入名称,则使用默认名称。

Token Classification

使用此配置可以使用执行令牌分类任务的模型。通过令牌分类,模型可以将文本字符串(标记)识别为可分类的实体(例如,地点、人和词性)。

有关详细信息,请参阅以下 Hugging Face 资源:

Token Classification 配置的可配置设置
字段 说明
Configuration 选择连接器配置。对于令牌分类任务中使用的模型,请选择Token Classification
Hugging Face Inference API endpoint 输入 Qlik Sense 可以访问模型的端点 URL。这通常是通过 Hugging Face Inference API 完成的。
Hugging Face API Token 输入您在创建帐户后生成的 Hugging Face API 令牌。这将验证您的帐户凭据,以便您可以使用外部服务。参阅生成 API 令牌
Aggregation Strategy

输入中实体的分类可以进行聚合处理。此参数指定进行分类时应用的聚合策略的类型。

从以下选项中进行选择:

  • None:没有进一步的聚合。

  • Simple:使用默认架构。

  • FirstSimple 选项的修改版本,其中通过使用第一个单词的标签来处理歧义。不同的标签不能应用于单词。

  • AverageSimple 选项的修改版本,其中使用了平均系统,并且不同的标签不能应用于单词。

  • MaxSimple 选项的修改版本,其中使用了评分系统,并且不同的标签不能应用于单词。

Simple 是默认选项。

Use Cache

默认情况下,此选项设置为 True。如果两次发出相同的请求,请选择是否使用缓存来重用模型响应。根据您的型号,您可能需要关闭此设置。

Wait For Model

默认情况下,此选项设置为 False。如果启用此选项,则可以通过在发出请求之前等待模型准备就绪来减少向 API 发出的请求数量。

Association Field

指定关联字段,该字段来自包含唯一标识符的输入数据表。这是一个可选参数。

当对使用密钥对返回的与源字段表相关联的结果表发出端点请求时,需要在源数据中包含该字段。指定的字段将作为字段返回到响应中,并使响应能够与数据模型中的源数据相关联。这可以是任何具有惟一 ID 的字段,可以来自源数据,也可以作为表加载过程的一部分。

Name 连接的名称。如果不输入名称,则使用默认名称。

Translation

使用此配置可以使用执行翻译任务的模型。模型可以将某种语言的输入文本翻译成另一种语言。

有关详细信息,请参阅以下 Hugging Face 资源:

Translation 配置的可配置设置
字段 说明
Configuration 选择连接器配置。对于翻译任务中使用的模型,请选择Translation
Hugging Face Inference API endpoint 输入 Qlik Sense 可以访问模型的端点 URL。这通常是通过 Hugging Face Inference API 完成的。
Hugging Face API Token 输入您在创建帐户后生成的 Hugging Face API 令牌。这将验证您的帐户凭据,以便您可以使用外部服务。参阅生成 API 令牌
Source Language

输入您要求翻译的输入文本的语言。可选参数。

信息注释每个模型提供的语言翻译能力可能各不相同。例如,可以将模型设计为仅在两种特定语言之间翻译文本。在这种情况下,将此参数留空是有意义的。
Target Language

输入将翻译的文本的目标语言。可选参数。

信息注释每个模型提供的语言翻译能力可能各不相同。例如,可以将模型设计为仅在两种特定语言之间翻译文本。在这种情况下,将此参数留空是有意义的。
Use Cache

默认情况下,此选项设置为 True。如果两次发出相同的请求,请选择是否使用缓存来重用模型响应。根据您的型号,您可能需要关闭此设置。

Wait For Model

默认情况下,此选项设置为 False。如果启用此选项,则可以通过在发出请求之前等待模型准备就绪来减少向 API 发出的请求数量。

Association Field

指定关联字段,该字段来自包含唯一标识符的输入数据表。这是一个可选参数。

当对使用密钥对返回的与源字段表相关联的结果表发出端点请求时,需要在源数据中包含该字段。指定的字段将作为字段返回到响应中,并使响应能够与数据模型中的源数据相关联。这可以是任何具有惟一 ID 的字段,可以来自源数据,也可以作为表加载过程的一部分。

Name 连接的名称。如果不输入名称,则使用默认名称。

创建新连接

您可以从 Analytics 活动中心、现有应用程序中的 数据加载编辑器 或现有脚本中的 脚本 创建到分析连接器的连接。按照以下步骤创建连接。

  1. 通过数据加载编辑器脚本 访问连接器。

  2. 单击创建新连接

  3. 空间下,选择连接所在的空间。

  4. 从数据连接器列表中选择 Hugging Face

  5. 填写连接对话框字段。

  6. 单击创建

数据连接保存到创建应用程序的空间中,因此可以在其他 Qlik Sense 应用程序和脚本中重复使用。它也列在 数据加载编辑器脚本 中的数据连接下。

一旦创建了连接,就可以使用它加载带有请求和平台对请求的响应的数据。此外,您还可以在图表表达式中使用它。有关更多信息,请参阅从 Hugging Face 连接选择并加载数据在可视化表达式中使用 Hugging Face 连接

了解详情

本页面有帮助吗?

如果您发现此页面或其内容有任何问题 – 打字错误、遗漏步骤或技术错误 – 请告诉我们如何改进!