Создание подключения Hugging Face
Чтобы обеспечить обмен данными Hugging Face, создайте подключение к источнику аналитики Hugging Face. Создайте подключение на странице «Создать страницу» в центре активности Аналитика, Редактор загрузки данных или Скрипт.
Данные, полученные из этих подключений, можно использовать в скрипте загрузки и выражениях диаграммы, чтобы расширить возможности аналитических приложений Qlik Sense.
Конфигурации и настраиваемые параметры
Настройте подключение к аналитике Hugging Face с использованием одной из следующих конфигураций. Каждое подключение может содержать одну конфигурацию.
Каждая доступная конфигурация коннектора Hugging Face соответствует общей задаче, которую требуется выполнять с моделью, предоставляемой через платформу Hugging Face. Для выполнения каждой задачи предоставляются тысячи моделей.
Не все модели Hugging Face доступны для использования с помощью коннектора Qlik Hugging Face. Доступность модели для использования в Qlik Sense отчасти зависит от внешних факторов. Могут действовать дополнительные ограничения и требования с учетом модели, которые влияют на возможности настройки конфигурации коннектора и обмена данными с ним. Полные сведения о конкретной модели см. в официальной документации Hugging Face.
Feature Extraction
Используйте эту конфигурацию для работы с моделями, которые выполняют задачи извлечения признаков. В общем, извлечение признаков — это технический процесс машинного обучения с многочисленными возможностями практического применения. При использовании этой задачи входные данные преобразуются в числовые признаки.
Для получения дополнительной информации см. следующие ресурсы Hugging Face:
-
Обзор задач извлечения признаков: Feature Extraction
-
Подробное описание параметров: Inference API - Detailed parameters
Поле | Описание |
---|---|
Configuration | Выберите конфигурацию коннектора. Для моделей, используемых в задачах извлечения признаков, выберите Feature Extraction. |
Hugging Face Inference API endpoint | Введите URL конечной точки, с использованием которого Qlik Sense может получить доступ к модели. Как правило, для этого используется Hugging Face Inference API. |
Hugging Face API Token | Введите токен API Hugging Face, сгенерированный после создания учетной записи. Он используется для проверки подлинности данных для входа в учетную запись, это необходимо для использования внешних служб. См. Создание токена API. |
Use Cache |
По умолчанию задано значение True (истина). Выберите, следует ли использовать кэширование для повторного использования ответов модели, если один и тот же запрос отправляется дважды. В зависимости от модели может потребоваться выключить этот параметр. |
Wait For Model |
По умолчанию задано значение False (ложь). Если этот параметр включен, можно сократить количество запросов, отправляемых в API, благодаря тому, что запрос не отправляется, пока модель не будет готова. |
Association Field |
Задайте поле связи, это поле из таблицы входных данных, содержащее уникальный идентификатор. Это необязательный параметр. Оно требуется для включения поля в исходные данные, когда отправляется запрос конечной точки для связывания возвращенной таблицы результатов с исходной таблицей поля с помощью ключа. Назначенное поле будет возвращено как поле в ответе и обеспечит возможность связывания с исходными данными в модели данных. Это может быть любое поле с уникальным ИД, из исходных данных или из процесса загрузки таблицы. |
Name | Имя подключения. Если поле оставлено пустым, используется имя по умолчанию. |
Question Answering
Используйте эту конфигурацию для работы с моделями, которые выполняют задачи ответа на вопросы. При выполнении задач ответа на вопросы модель можно использовать для извлечения ответа на вопрос с использованием отдельно предоставленного сегмента контекста. В Qlik Sense и вопрос и контекст предоставляются в данных приложения или скрипта.
Для получения дополнительной информации см. следующие ресурсы Hugging Face:
-
Обзор задач ответа на вопросы: Question Answering
-
Подробное описание параметров: Inference API - Detailed parameters
Поле | Описание |
---|---|
Configuration | Выберите конфигурацию коннектора. Для моделей, используемых в задачах ответа на вопросы, выберите Question Answering. |
Hugging Face Inference API endpoint | Введите URL конечной точки, с использованием которого Qlik Sense может получить доступ к модели. Как правило, для этого используется Hugging Face Inference API. |
Hugging Face API Token | Введите токен API Hugging Face, сгенерированный после создания учетной записи. Он используется для проверки подлинности данных для входа в учетную запись, это необходимо для использования внешних служб. См. Создание токена API. |
Use Cache |
По умолчанию задано значение True (истина). Выберите, следует ли использовать кэширование для повторного использования ответов модели, если один и тот же запрос отправляется дважды. В зависимости от модели может потребоваться выключить этот параметр. |
Wait For Model |
По умолчанию задано значение False (ложь). Если этот параметр включен, можно сократить количество запросов, отправляемых в API, благодаря тому, что запрос не отправляется, пока модель не будет готова. |
Association Field |
Задайте поле связи, это поле из таблицы входных данных, содержащее уникальный идентификатор. Это необязательный параметр. Оно требуется для включения поля в исходные данные, когда отправляется запрос конечной точки для связывания возвращенной таблицы результатов с исходной таблицей поля с помощью ключа. Назначенное поле будет возвращено как поле в ответе и обеспечит возможность связывания с исходными данными в модели данных. Это может быть любое поле с уникальным ИД, из исходных данных или из процесса загрузки таблицы. |
Name | Имя подключения. Если поле оставлено пустым, используется имя по умолчанию. |
Summarization
Используйте эту конфигурацию для работы с моделями, которые выполняют задачи реферирования. Модель выполняет реферирование путем создания краткого изложения входного текста с сохранением основных сведений.
Для получения дополнительной информации см. следующие ресурсы Hugging Face:
-
Обзор задач реферирования: Summarization
-
Подробное описание параметров: Inference API - Detailed parameters
Поле | Описание |
---|---|
Configuration | Выберите конфигурацию коннектора. Для моделей, используемых в задачах реферирования, выберите Summarization. |
Hugging Face Inference API endpoint | Введите URL конечной точки, с использованием которого Qlik Sense может получить доступ к модели. Как правило, для этого используется Hugging Face Inference API. |
Hugging Face API Token | Введите токен API Hugging Face, сгенерированный после создания учетной записи. Он используется для проверки подлинности данных для входа в учетную запись, это необходимо для использования внешних служб. См. Создание токена API. |
Minimum Token Length | Задайте целое число, обозначающее минимальное количество токенов, которое должно использоваться в выходных данных модели. Дополнительный параметр. Если значение не задано, для выходных данных не будет установлено минимальной длины. |
Maximum Token Length | Задайте целое число, обозначающее максимальное количество токенов, которое должно использоваться в выходных данных модели. Дополнительный параметр. Если значение не задано, для выходных данных не будет установлена максимальная длина. |
Top K | Задайте целое число, обозначающее количество наиболее вероятных токенов, которое должно использоваться в выходных данных модели. Дополнительный параметр. Если значение не задано, для выходных данных не будет установлено максимальное количество наиболее вероятных токенов для использования в выходных данных. |
Top P |
Введите числовое значение (а именно, число с плавающей запятой), чтобы контролировать степень произвольности выходных данных с точки зрения вероятности токена. Полные сведения приводятся в документации Hugging Face. Дополнительный параметр. Если значение не задано, степенью произвольности выходных данных нельзя будет управлять путем выбора параметров. |
Temperature | Задайте значение с плавающей запятой (от 0,00 до 100,0), чтобы управлять произвольностью выходных данных. Как правило, чем выше значение, тем выше степень произвольности токенов. Значение по умолчанию: 1,0. Дополнительный параметр. |
Repetition Penalty | Задайте значение с плавающей запятой (от 0,00 до 100,0), чтобы применить штраф для повторяющихся токенов. Значение по умолчанию: 1,0. Дополнительный параметр. |
Maximum Query Time | Задайте значение с плавающей запятой (от 0 до 120,0), чтобы указать максимальное время (в секундах) для запроса. Это нестрогое ограничение. Дополнительный параметр. Если значение не задано, максимальное время запроса не устанавливается. |
Use Cache |
По умолчанию задано значение True (истина). Выберите, следует ли использовать кэширование для повторного использования ответов модели, если один и тот же запрос отправляется дважды. В зависимости от модели может потребоваться выключить этот параметр. |
Wait For Model |
По умолчанию задано значение False (ложь). Если этот параметр включен, можно сократить количество запросов, отправляемых в API, благодаря тому, что запрос не отправляется, пока модель не будет готова. |
Association Field |
Задайте поле связи, это поле из таблицы входных данных, содержащее уникальный идентификатор. Это необязательный параметр. Оно требуется для включения поля в исходные данные, когда отправляется запрос конечной точки для связывания возвращенной таблицы результатов с исходной таблицей поля с помощью ключа. Назначенное поле будет возвращено как поле в ответе и обеспечит возможность связывания с исходными данными в модели данных. Это может быть любое поле с уникальным ИД, из исходных данных или из процесса загрузки таблицы. |
Name | Имя подключения. Если поле оставлено пустым, используется имя по умолчанию. |
Sentence Similarity
Используйте эту конфигурацию для работы с моделями, которые выполняют анализ сходства предложений. В задачах этого типа модель сравнивает одно или несколько разных предложений с исходным предложением, производя встраивания, которые хранят информацию о взаимном сходстве. Эти встраивания являются числовыми значениями. Использование встраиваний — это процесс машинного обучения повышенной сложности.
В Qlik Sense исходное предложение предоставляется в конфигурации коннектора, а входные предложения (которые модель сравнивает с исходным) предоставляются в данных приложения или скрипта.
Для получения дополнительной информации см. следующие ресурсы Hugging Face:
-
Обзор задач анализа сходства предложений: Sentence Similarity
-
Подробное описание параметров: Inference API - Detailed parameters
Поле | Описание |
---|---|
Configuration | Выберите конфигурацию коннектора. Для моделей, используемых в задачах анализа сходства предложений, выберите Sentence Similarity. |
Hugging Face Inference API endpoint | Введите URL конечной точки, с использованием которого Qlik Sense может получить доступ к модели. Как правило, для этого используется Hugging Face Inference API. |
Hugging Face API Token | Введите токен API Hugging Face, сгенерированный после создания учетной записи. Он используется для проверки подлинности данных для входа в учетную запись, это необходимо для использования внешних служб. См. Создание токена API. |
Source Sentence |
Текстовая строка, которую модель сравнивает с каждым элементом входных данных, оценивая сходство между двумя стоками. |
Use Cache |
По умолчанию задано значение True (истина). Выберите, следует ли использовать кэширование для повторного использования ответов модели, если один и тот же запрос отправляется дважды. В зависимости от модели может потребоваться выключить этот параметр. |
Wait For Model |
По умолчанию задано значение False (ложь). Если этот параметр включен, можно сократить количество запросов, отправляемых в API, благодаря тому, что запрос не отправляется, пока модель не будет готова. |
Association Field |
Задайте поле связи, это поле из таблицы входных данных, содержащее уникальный идентификатор. Это необязательный параметр. Оно требуется для включения поля в исходные данные, когда отправляется запрос конечной точки для связывания возвращенной таблицы результатов с исходной таблицей поля с помощью ключа. Назначенное поле будет возвращено как поле в ответе и обеспечит возможность связывания с исходными данными в модели данных. Это может быть любое поле с уникальным ИД, из исходных данных или из процесса загрузки таблицы. |
Name | Имя подключения. Если поле оставлено пустым, используется имя по умолчанию. |
Text Classification
Используйте эту конфигурацию для работы с моделями, которые выполняют задачи классификации текста. Классификация текста — это универсальный тип задачи, в которой модель может выполнять анализ эмоциональной окраски, проверку грамматической правильности и другие операции в рамках обработки лингвистической информации.
Для получения дополнительной информации см. следующие ресурсы Hugging Face:
-
Обзор задач классификации текста: Text Classification
-
Подробное описание параметров: Inference API - Detailed parameters
Поле | Описание |
---|---|
Configuration | Выберите конфигурацию коннектора. Для моделей, используемых в задачах классификации текста, выберите Text Classification. |
Hugging Face Inference API endpoint | Введите URL конечной точки, с использованием которого Qlik Sense может получить доступ к модели. Как правило, для этого используется Hugging Face Inference API. |
Hugging Face API Token | Введите токен API Hugging Face, сгенерированный после создания учетной записи. Он используется для проверки подлинности данных для входа в учетную запись, это необходимо для использования внешних служб. См. Создание токена API. |
Use Cache |
По умолчанию задано значение True (истина). Выберите, следует ли использовать кэширование для повторного использования ответов модели, если один и тот же запрос отправляется дважды. В зависимости от модели может потребоваться выключить этот параметр. |
Wait For Model |
По умолчанию задано значение False (ложь). Если этот параметр включен, можно сократить количество запросов, отправляемых в API, благодаря тому, что запрос не отправляется, пока модель не будет готова. |
Association Field |
Задайте поле связи, это поле из таблицы входных данных, содержащее уникальный идентификатор. Это необязательный параметр. Оно требуется для включения поля в исходные данные, когда отправляется запрос конечной точки для связывания возвращенной таблицы результатов с исходной таблицей поля с помощью ключа. Назначенное поле будет возвращено как поле в ответе и обеспечит возможность связывания с исходными данными в модели данных. Это может быть любое поле с уникальным ИД, из исходных данных или из процесса загрузки таблицы. |
Name | Имя подключения. Если поле оставлено пустым, используется имя по умолчанию. |
Text Generation
Используйте эту конфигурацию для работы с моделями, которые выполняют задачи генерирования текста. Модели, использующие этот тип задачи, обычно могут завершать неполные сегменты текста или выполнять перефразирования текста.
Для получения дополнительной информации см. следующие ресурсы Hugging Face:
-
Обзор задач генерирования текста: Text Generation
-
Подробное описание параметров: Inference API - Detailed parameters
Поле | Описание |
---|---|
Configuration | Выберите конфигурацию коннектора. Для моделей, используемых в задачах генерирования текста, выберите Text Generation. |
Hugging Face Inference API endpoint | Введите URL конечной точки, с использованием которого Qlik Sense может получить доступ к модели. Как правило, для этого используется Hugging Face Inference API. |
Hugging Face API Token | Введите токен API Hugging Face, сгенерированный после создания учетной записи. Он используется для проверки подлинности данных для входа в учетную запись, это необходимо для использования внешних служб. См. Создание токена API. |
Maximum Token Length | Задайте целое число, обозначающее максимальное количество токенов, которое должно использоваться в выходных данных модели. Дополнительный параметр. Если значение не задано, для выходных данных не будет установлена максимальная длина. |
Top K | Задайте целое число, обозначающее количество наиболее вероятных токенов, которое должно использоваться в выходных данных модели. Дополнительный параметр. Если значение не задано, для выходных данных не будет установлено максимальное количество наиболее вероятных токенов для использования в выходных данных. |
Top P |
Введите числовое значение (а именно, число с плавающей запятой), чтобы контролировать степень произвольности выходных данных с точки зрения вероятности токена. Полные сведения приводятся в документации Hugging Face. Дополнительный параметр. Если значение не задано, степенью произвольности выходных данных нельзя будет управлять путем выбора параметров. |
Temperature | Задайте значение с плавающей запятой (от 0,00 до 100,0), чтобы управлять произвольностью выходных данных. Как правило, чем выше значение, тем выше степень произвольности токенов. Значение по умолчанию: 1,0. Дополнительный параметр. |
Repetition Penalty | Задайте значение с плавающей запятой (от 0,00 до 100,0), чтобы применить штраф для повторяющихся токенов. Значение по умолчанию: 1,0. Дополнительный параметр. |
Maximum Query Time | Задайте значение с плавающей запятой (от 0 до 120,0), чтобы указать максимальное время (в секундах) для запроса. Это нестрогое ограничение. Дополнительный параметр. Если значение не задано, максимальное время запроса не устанавливается. |
Use Cache |
По умолчанию задано значение True (истина). Выберите, следует ли использовать кэширование для повторного использования ответов модели, если один и тот же запрос отправляется дважды. В зависимости от модели может потребоваться выключить этот параметр. |
Wait For Model |
По умолчанию задано значение False (ложь). Если этот параметр включен, можно сократить количество запросов, отправляемых в API, благодаря тому, что запрос не отправляется, пока модель не будет готова. |
Association Field |
Задайте поле связи, это поле из таблицы входных данных, содержащее уникальный идентификатор. Это необязательный параметр. Оно требуется для включения поля в исходные данные, когда отправляется запрос конечной точки для связывания возвращенной таблицы результатов с исходной таблицей поля с помощью ключа. Назначенное поле будет возвращено как поле в ответе и обеспечит возможность связывания с исходными данными в модели данных. Это может быть любое поле с уникальным ИД, из исходных данных или из процесса загрузки таблицы. |
Name | Имя подключения. Если поле оставлено пустым, используется имя по умолчанию. |
Token Classification
Используйте эту конфигурацию для работы с моделями, которые выполняют задачи классификации токенов. С помощью классификации токенов модель может идентифицировать текстовые строки (токены) в качестве классифицируемых сущностей (например, места, люди и части речи).
Для получения дополнительной информации см. следующие ресурсы Hugging Face:
-
Обзор задач классификации токенов: Token Classification
-
Подробное описание параметров: Inference API - Detailed parameters
Поле | Описание |
---|---|
Configuration | Выберите конфигурацию коннектора. Для моделей, используемых в задачах классификации токенов, выберите Token Classification. |
Hugging Face Inference API endpoint | Введите URL конечной точки, с использованием которого Qlik Sense может получить доступ к модели. Как правило, для этого используется Hugging Face Inference API. |
Hugging Face API Token | Введите токен API Hugging Face, сгенерированный после создания учетной записи. Он используется для проверки подлинности данных для входа в учетную запись, это необходимо для использования внешних служб. См. Создание токена API. |
Aggregation Strategy |
При классификации сущностей во входных данных может осуществляться обработка методом агрегирования. Этот параметр указывает тип стратегии агрегирования, применяемой при создании классификаций. Можно выбрать из следующих вариантов:
Simple является вариантом по умолчанию. |
Use Cache |
По умолчанию задано значение True (истина). Выберите, следует ли использовать кэширование для повторного использования ответов модели, если один и тот же запрос отправляется дважды. В зависимости от модели может потребоваться выключить этот параметр. |
Wait For Model |
По умолчанию задано значение False (ложь). Если этот параметр включен, можно сократить количество запросов, отправляемых в API, благодаря тому, что запрос не отправляется, пока модель не будет готова. |
Association Field |
Задайте поле связи, это поле из таблицы входных данных, содержащее уникальный идентификатор. Это необязательный параметр. Оно требуется для включения поля в исходные данные, когда отправляется запрос конечной точки для связывания возвращенной таблицы результатов с исходной таблицей поля с помощью ключа. Назначенное поле будет возвращено как поле в ответе и обеспечит возможность связывания с исходными данными в модели данных. Это может быть любое поле с уникальным ИД, из исходных данных или из процесса загрузки таблицы. |
Name | Имя подключения. Если поле оставлено пустым, используется имя по умолчанию. |
Translation
Используйте эту конфигурацию для работы с моделями, которые выполняют задачи перевода. Модели могут переводить текст, введенный на определенном языке, на другой язык.
Для получения дополнительной информации см. следующие ресурсы Hugging Face:
-
Обзор задач перевода: Translation
-
Подробное описание параметров: Inference API - Detailed parameters
Поле | Описание |
---|---|
Configuration | Выберите конфигурацию коннектора. Для моделей, используемых в задачах перевода, выберите Translation. |
Hugging Face Inference API endpoint | Введите URL конечной точки, с использованием которого Qlik Sense может получить доступ к модели. Как правило, для этого используется Hugging Face Inference API. |
Hugging Face API Token | Введите токен API Hugging Face, сгенерированный после создания учетной записи. Он используется для проверки подлинности данных для входа в учетную запись, это необходимо для использования внешних служб. См. Создание токена API. |
Source Language |
Введите язык входного текста, который необходимо перевести. Дополнительный параметр. Примечание к информацииВозможности языкового перевода варьируются в зависимости от модели. Например, модель можно разработать так, чтобы перевод осуществлялся только между двумя конкретными языками. В таком случае этот параметр лучше оставить пустым.
|
Target Language |
Введите язык, на который нужно перевести введенный текст. Дополнительный параметр. Примечание к информацииВозможности языкового перевода варьируются в зависимости от модели. Например, модель можно разработать так, чтобы перевод осуществлялся только между двумя конкретными языками. В таком случае этот параметр лучше оставить пустым.
|
Use Cache |
По умолчанию задано значение True (истина). Выберите, следует ли использовать кэширование для повторного использования ответов модели, если один и тот же запрос отправляется дважды. В зависимости от модели может потребоваться выключить этот параметр. |
Wait For Model |
По умолчанию задано значение False (ложь). Если этот параметр включен, можно сократить количество запросов, отправляемых в API, благодаря тому, что запрос не отправляется, пока модель не будет готова. |
Association Field |
Задайте поле связи, это поле из таблицы входных данных, содержащее уникальный идентификатор. Это необязательный параметр. Оно требуется для включения поля в исходные данные, когда отправляется запрос конечной точки для связывания возвращенной таблицы результатов с исходной таблицей поля с помощью ключа. Назначенное поле будет возвращено как поле в ответе и обеспечит возможность связывания с исходными данными в модели данных. Это может быть любое поле с уникальным ИД, из исходных данных или из процесса загрузки таблицы. |
Name | Имя подключения. Если поле оставлено пустым, используется имя по умолчанию. |
Создание нового подключения
Можно создать подключение к коннектору аналитики в центре активности Аналитика, из Редактор загрузки данных в существующем приложении или из Скрипт в существующем скрипте. Выполните перечисленные ниже действия, чтобы создать подключение.
Выполните следующие действия.
-
Вызовите коннектор через редактор загрузки данных или Скрипт.
-
Щелкните команду Создать новое подключение.
-
В области Пространство выберите пространство, где будет находиться подключение.
-
Выберите Hugging Face из списка коннекторов данных.
-
Заполните поля диалогового окна подключения.
-
Нажмите кнопку Создать.
Подключение к данным сохраняется в пространстве, где создано приложение, чтобы его могли использовать и другие приложения или скрипты Qlik Sense. Оно отображается в списке Подключения к данным в Редактор загрузки данных или Скрипт.
Созданное подключение можно использовать для загрузки данных вместе с запросами и с ответами платформы на них. Кроме того, его можно использовать в выражениях диаграммы. Для получения дополнительной информации см. разделы Выбор и загрузка данных из подключения Hugging Face и Использование подключений Hugging Face в выражениях визуализации.