Перейти к основному содержимому Перейти к дополнительному содержимому

Создание подключения Hugging Face

Чтобы обеспечить обмен данными с Hugging Face, создайте подключение к источнику аналитики Hugging Face. Создайте подключение в хабе, Редактор загрузки данных или Редактор скриптов.

Данные, полученные из этих подключений, можно использовать в скрипте загрузки и выражениях диаграммы, чтобы расширить возможности аналитических приложений Qlik Sense.

Конфигурации и настраиваемые параметры

Настройте подключение к аналитике Hugging Face с использованием одной из следующих конфигураций. Каждое подключение может содержать одну конфигурацию.

Каждая доступная конфигурация коннектора Hugging Face соответствует общей задаче, которую требуется выполнять с моделью, предоставляемой через платформу Hugging Face. Для выполнения каждой задачи предоставляются тысячи моделей.

Не все модели Hugging Face доступны для использования с помощью коннектора Qlik Hugging Face. Доступность модели для использования в Qlik Sense отчасти зависит от внешних факторов. Могут действовать дополнительные ограничения и требования с учетом модели, которые влияют на возможности настройки конфигурации коннектора и обмена данными с ним. Полные сведения о конкретной модели см. в официальной документации Hugging Face.

Tasks

Models

Feature Extraction

Используйте эту конфигурацию для работы с моделями, которые выполняют задачи извлечения признаков. В общем, извлечение признаков — это технический процесс машинного обучения с многочисленными возможностями практического применения. При использовании этой задачи входные данные преобразуются в числовые признаки.

Для получения дополнительной информации см. следующие ресурсы Hugging Face:

Настраиваемые параметры для конфигурации Feature Extraction
Поле Описание
Configuration Выберите конфигурацию коннектора. Для моделей, используемых в задачах извлечения признаков, выберите Feature Extraction.
Hugging Face Inference API endpoint Введите URL конечной точки, с использованием которого Qlik Sense может получить доступ к модели. Как правило, для этого используется Hugging Face Inference API.
Hugging Face API Token Введите токен API Hugging Face, сгенерированный после создания учетной записи. Он используется для проверки подлинности данных для входа в учетную запись, это необходимо для использования внешних служб. См. Создание токена API.
Use Cache

По умолчанию задано значение True (истина). Выберите, следует ли использовать кэширование для повторного использования ответов модели, если один и тот же запрос отправляется дважды. В зависимости от модели может потребоваться выключить этот параметр.

Wait For Model

По умолчанию задано значение False (ложь). Если этот параметр включен, можно сократить количество запросов, отправляемых в API, благодаря тому, что запрос не отправляется, пока модель не будет готова.

Association Field

Задайте поле связи, это поле из таблицы входных данных, содержащее уникальный идентификатор. Это необязательный параметр.

Оно требуется для включения поля в исходные данные, когда отправляется запрос конечной точки для связывания возвращенной таблицы результатов с исходной таблицей поля с помощью ключа. Назначенное поле будет возвращено как поле в ответе и обеспечит возможность связывания с исходными данными в модели данных. Это может быть любое поле с уникальным ИД, из исходных данных или из процесса загрузки таблицы.

Name Имя подключения. Если поле оставлено пустым, используется имя по умолчанию.

Question Answering

Используйте эту конфигурацию для работы с моделями, которые выполняют задачи ответа на вопросы. При выполнении задач ответа на вопросы модель можно использовать для извлечения ответа на вопрос с использованием отдельно предоставленного сегмента контекста. В Qlik Sense и вопрос и контекст предоставляются в данных приложения или скрипта.

Для получения дополнительной информации см. следующие ресурсы Hugging Face:

Настраиваемые параметры для конфигурации Question Answering
Поле Описание
Configuration Выберите конфигурацию коннектора. Для моделей, используемых в задачах ответа на вопросы, выберите Question Answering.
Hugging Face Inference API endpoint Введите URL конечной точки, с использованием которого Qlik Sense может получить доступ к модели. Как правило, для этого используется Hugging Face Inference API.
Hugging Face API Token Введите токен API Hugging Face, сгенерированный после создания учетной записи. Он используется для проверки подлинности данных для входа в учетную запись, это необходимо для использования внешних служб. См. Создание токена API.
Use Cache

По умолчанию задано значение True (истина). Выберите, следует ли использовать кэширование для повторного использования ответов модели, если один и тот же запрос отправляется дважды. В зависимости от модели может потребоваться выключить этот параметр.

Wait For Model

По умолчанию задано значение False (ложь). Если этот параметр включен, можно сократить количество запросов, отправляемых в API, благодаря тому, что запрос не отправляется, пока модель не будет готова.

Association Field

Задайте поле связи, это поле из таблицы входных данных, содержащее уникальный идентификатор. Это необязательный параметр.

Оно требуется для включения поля в исходные данные, когда отправляется запрос конечной точки для связывания возвращенной таблицы результатов с исходной таблицей поля с помощью ключа. Назначенное поле будет возвращено как поле в ответе и обеспечит возможность связывания с исходными данными в модели данных. Это может быть любое поле с уникальным ИД, из исходных данных или из процесса загрузки таблицы.

Name Имя подключения. Если поле оставлено пустым, используется имя по умолчанию.

Summarization

Используйте эту конфигурацию для работы с моделями, которые выполняют задачи реферирования. Модель выполняет реферирование путем создания краткого изложения входного текста с сохранением основных сведений.

Для получения дополнительной информации см. следующие ресурсы Hugging Face:

Настраиваемые параметры для конфигурации Summarization
Поле Описание
Configuration Выберите конфигурацию коннектора. Для моделей, используемых в задачах реферирования, выберите Summarization.
Hugging Face Inference API endpoint Введите URL конечной точки, с использованием которого Qlik Sense может получить доступ к модели. Как правило, для этого используется Hugging Face Inference API.
Hugging Face API Token Введите токен API Hugging Face, сгенерированный после создания учетной записи. Он используется для проверки подлинности данных для входа в учетную запись, это необходимо для использования внешних служб. См. Создание токена API.
Minimum Token Length Задайте целое число, обозначающее минимальное количество токенов, которое должно использоваться в выходных данных модели. Дополнительный параметр. Если значение не задано, для выходных данных не будет установлено минимальной длины.
Maximum Token Length Задайте целое число, обозначающее максимальное количество токенов, которое должно использоваться в выходных данных модели. Дополнительный параметр. Если значение не задано, для выходных данных не будет установлена максимальная длина.
Top K Задайте целое число, обозначающее количество наиболее вероятных токенов, которое должно использоваться в выходных данных модели. Дополнительный параметр. Если значение не задано, для выходных данных не будет установлено максимальное количество наиболее вероятных токенов для использования в выходных данных.
Top P

Введите числовое значение (а именно, число с плавающей запятой), чтобы контролировать степень произвольности выходных данных с точки зрения вероятности токена.  Полные сведения приводятся в документации Hugging Face.

Дополнительный параметр. Если значение не задано, степенью произвольности выходных данных нельзя будет управлять путем выбора параметров.

Temperature Задайте значение с плавающей запятой (от 0,00 до 100,0), чтобы управлять произвольностью выходных данных. Как правило, чем выше значение, тем выше степень произвольности токенов. Значение по умолчанию: 1,0. Дополнительный параметр.
Repetition Penalty Задайте значение с плавающей запятой (от 0,00 до 100,0), чтобы применить штраф для повторяющихся токенов. Значение по умолчанию: 1,0. Дополнительный параметр.
Maximum Query Time Задайте значение с плавающей запятой (от 0 до 120,0), чтобы указать максимальное время (в секундах) для запроса. Это нестрогое ограничение. Дополнительный параметр. Если значение не задано, максимальное время запроса не устанавливается.
Use Cache

По умолчанию задано значение True (истина). Выберите, следует ли использовать кэширование для повторного использования ответов модели, если один и тот же запрос отправляется дважды. В зависимости от модели может потребоваться выключить этот параметр.

Wait For Model

По умолчанию задано значение False (ложь). Если этот параметр включен, можно сократить количество запросов, отправляемых в API, благодаря тому, что запрос не отправляется, пока модель не будет готова.

Association Field

Задайте поле связи, это поле из таблицы входных данных, содержащее уникальный идентификатор. Это необязательный параметр.

Оно требуется для включения поля в исходные данные, когда отправляется запрос конечной точки для связывания возвращенной таблицы результатов с исходной таблицей поля с помощью ключа. Назначенное поле будет возвращено как поле в ответе и обеспечит возможность связывания с исходными данными в модели данных. Это может быть любое поле с уникальным ИД, из исходных данных или из процесса загрузки таблицы.

Name Имя подключения. Если поле оставлено пустым, используется имя по умолчанию.

Sentence Similarity

Используйте эту конфигурацию для работы с моделями, которые выполняют анализ сходства предложений. В задачах этого типа модель сравнивает одно или несколько разных предложений с исходным предложением, производя встраивания, которые хранят информацию о взаимном сходстве. Эти встраивания являются числовыми значениями. Использование встраиваний — это процесс машинного обучения повышенной сложности.

В Qlik Sense исходное предложение предоставляется в конфигурации коннектора, а входные предложения (которые модель сравнивает с исходным) предоставляются в данных приложения или скрипта.

Для получения дополнительной информации см. следующие ресурсы Hugging Face:

Настраиваемые параметры для конфигурации Sentence Similarity
Поле Описание
Configuration Выберите конфигурацию коннектора. Для моделей, используемых в задачах анализа сходства предложений, выберите Sentence Similarity.
Hugging Face Inference API endpoint Введите URL конечной точки, с использованием которого Qlik Sense может получить доступ к модели. Как правило, для этого используется Hugging Face Inference API.
Hugging Face API Token Введите токен API Hugging Face, сгенерированный после создания учетной записи. Он используется для проверки подлинности данных для входа в учетную запись, это необходимо для использования внешних служб. См. Создание токена API.
Source Sentence

Текстовая строка, которую модель сравнивает с каждым элементом входных данных, оценивая сходство между двумя стоками.

Use Cache

По умолчанию задано значение True (истина). Выберите, следует ли использовать кэширование для повторного использования ответов модели, если один и тот же запрос отправляется дважды. В зависимости от модели может потребоваться выключить этот параметр.

Wait For Model

По умолчанию задано значение False (ложь). Если этот параметр включен, можно сократить количество запросов, отправляемых в API, благодаря тому, что запрос не отправляется, пока модель не будет готова.

Association Field

Задайте поле связи, это поле из таблицы входных данных, содержащее уникальный идентификатор. Это необязательный параметр.

Оно требуется для включения поля в исходные данные, когда отправляется запрос конечной точки для связывания возвращенной таблицы результатов с исходной таблицей поля с помощью ключа. Назначенное поле будет возвращено как поле в ответе и обеспечит возможность связывания с исходными данными в модели данных. Это может быть любое поле с уникальным ИД, из исходных данных или из процесса загрузки таблицы.

Name Имя подключения. Если поле оставлено пустым, используется имя по умолчанию.

Text Classification

Используйте эту конфигурацию для работы с моделями, которые выполняют задачи классификации текста. Классификация текста — это универсальный тип задачи, в которой модель может выполнять анализ эмоциональной окраски, проверку грамматической правильности и другие операции в рамках обработки лингвистической информации.

Для получения дополнительной информации см. следующие ресурсы Hugging Face:

Настраиваемые параметры для конфигурации Text Classification
Поле Описание
Configuration Выберите конфигурацию коннектора. Для моделей, используемых в задачах классификации текста, выберите Text Classification.
Hugging Face Inference API endpoint Введите URL конечной точки, с использованием которого Qlik Sense может получить доступ к модели. Как правило, для этого используется Hugging Face Inference API.
Hugging Face API Token Введите токен API Hugging Face, сгенерированный после создания учетной записи. Он используется для проверки подлинности данных для входа в учетную запись, это необходимо для использования внешних служб. См. Создание токена API.
Use Cache

По умолчанию задано значение True (истина). Выберите, следует ли использовать кэширование для повторного использования ответов модели, если один и тот же запрос отправляется дважды. В зависимости от модели может потребоваться выключить этот параметр.

Wait For Model

По умолчанию задано значение False (ложь). Если этот параметр включен, можно сократить количество запросов, отправляемых в API, благодаря тому, что запрос не отправляется, пока модель не будет готова.

Association Field

Задайте поле связи, это поле из таблицы входных данных, содержащее уникальный идентификатор. Это необязательный параметр.

Оно требуется для включения поля в исходные данные, когда отправляется запрос конечной точки для связывания возвращенной таблицы результатов с исходной таблицей поля с помощью ключа. Назначенное поле будет возвращено как поле в ответе и обеспечит возможность связывания с исходными данными в модели данных. Это может быть любое поле с уникальным ИД, из исходных данных или из процесса загрузки таблицы.

Name Имя подключения. Если поле оставлено пустым, используется имя по умолчанию.

Text Generation

Используйте эту конфигурацию для работы с моделями, которые выполняют задачи генерирования текста. Модели, использующие этот тип задачи, обычно могут завершать неполные сегменты текста или выполнять перефразирования текста.

Для получения дополнительной информации см. следующие ресурсы Hugging Face:

Настраиваемые параметры для конфигурации Text Generation
Поле Описание
Configuration Выберите конфигурацию коннектора. Для моделей, используемых в задачах генерирования текста, выберите Text Generation.
Hugging Face Inference API endpoint Введите URL конечной точки, с использованием которого Qlik Sense может получить доступ к модели. Как правило, для этого используется Hugging Face Inference API.
Hugging Face API Token Введите токен API Hugging Face, сгенерированный после создания учетной записи. Он используется для проверки подлинности данных для входа в учетную запись, это необходимо для использования внешних служб. См. Создание токена API.
Maximum Token Length Задайте целое число, обозначающее максимальное количество токенов, которое должно использоваться в выходных данных модели. Дополнительный параметр. Если значение не задано, для выходных данных не будет установлена максимальная длина.
Top K Задайте целое число, обозначающее количество наиболее вероятных токенов, которое должно использоваться в выходных данных модели. Дополнительный параметр. Если значение не задано, для выходных данных не будет установлено максимальное количество наиболее вероятных токенов для использования в выходных данных.
Top P

Введите числовое значение (а именно, число с плавающей запятой), чтобы контролировать степень произвольности выходных данных с точки зрения вероятности токена.  Полные сведения приводятся в документации Hugging Face.

Дополнительный параметр. Если значение не задано, степенью произвольности выходных данных нельзя будет управлять путем выбора параметров.

Temperature Задайте значение с плавающей запятой (от 0,00 до 100,0), чтобы управлять произвольностью выходных данных. Как правило, чем выше значение, тем выше степень произвольности токенов. Значение по умолчанию: 1,0. Дополнительный параметр.
Repetition Penalty Задайте значение с плавающей запятой (от 0,00 до 100,0), чтобы применить штраф для повторяющихся токенов. Значение по умолчанию: 1,0. Дополнительный параметр.
Maximum Query Time Задайте значение с плавающей запятой (от 0 до 120,0), чтобы указать максимальное время (в секундах) для запроса. Это нестрогое ограничение. Дополнительный параметр. Если значение не задано, максимальное время запроса не устанавливается.
Use Cache

По умолчанию задано значение True (истина). Выберите, следует ли использовать кэширование для повторного использования ответов модели, если один и тот же запрос отправляется дважды. В зависимости от модели может потребоваться выключить этот параметр.

Wait For Model

По умолчанию задано значение False (ложь). Если этот параметр включен, можно сократить количество запросов, отправляемых в API, благодаря тому, что запрос не отправляется, пока модель не будет готова.

Association Field

Задайте поле связи, это поле из таблицы входных данных, содержащее уникальный идентификатор. Это необязательный параметр.

Оно требуется для включения поля в исходные данные, когда отправляется запрос конечной точки для связывания возвращенной таблицы результатов с исходной таблицей поля с помощью ключа. Назначенное поле будет возвращено как поле в ответе и обеспечит возможность связывания с исходными данными в модели данных. Это может быть любое поле с уникальным ИД, из исходных данных или из процесса загрузки таблицы.

Name Имя подключения. Если поле оставлено пустым, используется имя по умолчанию.

Token Classification

Используйте эту конфигурацию для работы с моделями, которые выполняют задачи классификации токенов. С помощью классификации токенов модель может идентифицировать текстовые строки (токены) в качестве классифицируемых сущностей (например, места, люди и части речи).

Для получения дополнительной информации см. следующие ресурсы Hugging Face:

Настраиваемые параметры для конфигурации Token Classification
Поле Описание
Configuration Выберите конфигурацию коннектора. Для моделей, используемых в задачах классификации токенов, выберите Token Classification.
Hugging Face Inference API endpoint Введите URL конечной точки, с использованием которого Qlik Sense может получить доступ к модели. Как правило, для этого используется Hugging Face Inference API.
Hugging Face API Token Введите токен API Hugging Face, сгенерированный после создания учетной записи. Он используется для проверки подлинности данных для входа в учетную запись, это необходимо для использования внешних служб. См. Создание токена API.
Aggregation Strategy

При классификации сущностей во входных данных может осуществляться обработка методом агрегирования. Этот параметр указывает тип стратегии агрегирования, применяемой при создании классификаций.

Можно выбрать из следующих вариантов:

  • None: Без дальнейшего агрегирования.

  • Simple: С использованием схемы по умолчанию.

  • First:  Модифицированная версия варианта Simple, в которой неоднозначность обрабатывается с использованием тега первого слова. К словам нельзя применять разные теги.

  • Average:  Модифицированная версия варианта Simple, в которой используется система усреднения и к словам нельзя применять разные теги.

  • Max:  Модифицированная версия варианта Simple, в которой используется система оценки и к словам нельзя применять разные теги.

Simple является вариантом по умолчанию.

Use Cache

По умолчанию задано значение True (истина). Выберите, следует ли использовать кэширование для повторного использования ответов модели, если один и тот же запрос отправляется дважды. В зависимости от модели может потребоваться выключить этот параметр.

Wait For Model

По умолчанию задано значение False (ложь). Если этот параметр включен, можно сократить количество запросов, отправляемых в API, благодаря тому, что запрос не отправляется, пока модель не будет готова.

Association Field

Задайте поле связи, это поле из таблицы входных данных, содержащее уникальный идентификатор. Это необязательный параметр.

Оно требуется для включения поля в исходные данные, когда отправляется запрос конечной точки для связывания возвращенной таблицы результатов с исходной таблицей поля с помощью ключа. Назначенное поле будет возвращено как поле в ответе и обеспечит возможность связывания с исходными данными в модели данных. Это может быть любое поле с уникальным ИД, из исходных данных или из процесса загрузки таблицы.

Name Имя подключения. Если поле оставлено пустым, используется имя по умолчанию.

Translation

Используйте эту конфигурацию для работы с моделями, которые выполняют задачи перевода. Модели могут переводить текст, введенный на определенном языке, на другой язык.

Для получения дополнительной информации см. следующие ресурсы Hugging Face:

Настраиваемые параметры для конфигурации Translation
Поле Описание
Configuration Выберите конфигурацию коннектора. Для моделей, используемых в задачах перевода, выберите Translation.
Hugging Face Inference API endpoint Введите URL конечной точки, с использованием которого Qlik Sense может получить доступ к модели. Как правило, для этого используется Hugging Face Inference API.
Hugging Face API Token Введите токен API Hugging Face, сгенерированный после создания учетной записи. Он используется для проверки подлинности данных для входа в учетную запись, это необходимо для использования внешних служб. См. Создание токена API.
Source Language

Введите язык входного текста, который необходимо перевести. Дополнительный параметр.

Примечание к информацииВозможности языкового перевода варьируются в зависимости от модели. Например, модель можно разработать так, чтобы перевод осуществлялся только между двумя конкретными языками. В таком случае этот параметр лучше оставить пустым.
Target Language

Введите язык, на который нужно перевести введенный текст. Дополнительный параметр.

Примечание к информацииВозможности языкового перевода варьируются в зависимости от модели. Например, модель можно разработать так, чтобы перевод осуществлялся только между двумя конкретными языками. В таком случае этот параметр лучше оставить пустым.
Use Cache

По умолчанию задано значение True (истина). Выберите, следует ли использовать кэширование для повторного использования ответов модели, если один и тот же запрос отправляется дважды. В зависимости от модели может потребоваться выключить этот параметр.

Wait For Model

По умолчанию задано значение False (ложь). Если этот параметр включен, можно сократить количество запросов, отправляемых в API, благодаря тому, что запрос не отправляется, пока модель не будет готова.

Association Field

Задайте поле связи, это поле из таблицы входных данных, содержащее уникальный идентификатор. Это необязательный параметр.

Оно требуется для включения поля в исходные данные, когда отправляется запрос конечной точки для связывания возвращенной таблицы результатов с исходной таблицей поля с помощью ключа. Назначенное поле будет возвращено как поле в ответе и обеспечит возможность связывания с исходными данными в модели данных. Это может быть любое поле с уникальным ИД, из исходных данных или из процесса загрузки таблицы.

Name Имя подключения. Если поле оставлено пустым, используется имя по умолчанию.

Создание нового подключения

Можно создать подключение к аналитическому коннектору в хабе, из Редактор загрузки данных в существующем приложении или из Редактор скриптов в существующем скрипте. Выполните перечисленные ниже действия, чтобы создать подключение.

  1. Вызовите коннектор через редактор загрузки данных или Редактор скриптов.

    Щелкните команду Создать новое подключение и выберите в списке коннектор Hugging Face.

  2. Заполните поля диалогового окна подключения.

  3. Нажмите кнопку Создать.

Подключение к данным сохраняется в пространстве, где создано приложение, чтобы его могли использовать и другие приложения или скрипты Qlik Sense. Оно отображается в списке Подключения к данным в Редактор загрузки данных или Редактор скриптов.

Созданное подключение можно использовать для загрузки данных вместе с запросами и с ответами платформы на них. Кроме того, его можно использовать в выражениях диаграммы. Для получения дополнительной информации см. разделы Выбор и загрузка данных из подключения Hugging Face и Использование подключений Hugging Face в выражениях визуализации.

Подробнее

Помогла ли вам эта страница?

Если вы обнаружили какую-либо проблему на этой странице и с ее содержанием — будь то опечатка, пропущенный шаг или техническая ошибка, сообщите нам об этом, чтобы мы смогли ее исправить!