Перейти к основному содержимому Перейти к дополнительному содержимому

Создание витрины знаний

Витрины знаний позволяют встраивать и хранить ваши структурированные данные в векторной базе данных. Это позволяет извлекать дополненный контекст с функциональностью семантического поиска для использования в качестве контекста для приложений Retrieval Augmented Generation (RAG).

Выходные данные представлены в формате JSON.

Примечание к информацииВам нужна подписка Qlik Talend Cloud Enterprise.
Примечание к информацииЭта функциональность поддерживается только на платформах Snowflake и для шлюза данных, управляемого клиентом. Snowflake Iceberg не поддерживается.

Установка Qlik Data Gateway — Data Movement

Перед созданием хранилища знаний необходимо установить определенный Qlik Data Gateway — Data Movement. Для получения дополнительной информации см. раздел Настройка Qlik Data Gateway — Data Movement для киосков баз знаний.

Поддерживаемые подключения

Для получения информации о поддерживаемых:

Создание данных

  1. Нажмите Проекты в левом меню и откройте проект.
  2. Со страницы Проекта можно создавать и публиковать документы в векторной базе данных. Выполните одно из следующих действий.
    • Нажмите Создать > Витрина знаний.
    • Нажмите Значок «Действия» задачи данных > Витрина знаний.

    Откроется окно настройки конфигурации.

  3. Введите имя.
  4. Введите описание. Это необязательно.
  5. Выберите, где хранить документы, из раскрывающегося списка Хранить векторы в. Чтобы хранить документы с проектом, выберите Платформа проекта данных.
  6. Если вы выбрали Внешнюю векторную базу данных, создайте или выберите подключение к векторной базе данных. Документы и векторы будут храниться в этой векторной базе данных.
  7. Создайте или выберите LLM-подключение. Это подключение требуется для использования семантического поиска.
  8. Нажмите Создать.
  9. При создании данных добавьте документы.

Добавление документов

Примечание к информацииПоддерживается только текстовый формат. Например, текст из диаграмм или изображений не может быть извлечен.
  1. На вкладке Наборы данных страницы Задачи данных нажмите Добавить на левой панели.
  2. Выберите базовый набор данных, из которого будет сгенерирован документ. Документ будет создан для каждой записи. Например, для списка пациентов будет создан документ для каждого пациента.
  3. Поле Имя схемы документа предварительно заполняется именем выбранного базового набора данных. Переименуйте при необходимости.
  4. Введите описание. Это необязательно.
  5. Выберите данные, которые вы хотите включить для обогащения документа.
  6. Нажмите кнопку ОК. Вы вернулись на вкладку Схемы документов.
  7. Выберите вкладку Наборы данных.
  8. На левой панели выберите набор данных, который вы выбрали ранее в качестве базового набора данных.
  9. Чтобы удалить данные, которые вы не хотите включать в документы, установите флажок и нажмите Удалить.
  10. Чтобы улучшить семантический поиск, выполняемый LLM, переименуйте данные, чьи имена недостаточно понятны.

    Переименовать dt в date.

  11. Когда вы удалили и переименовали данные при необходимости, нажмите Значок «Действия» справа > Подготовить. Документы генерируются в JSON формате.
  12. Когда документы генерируются:
    1. Выберите вкладку Наборы данных.
    2. Чтобы проверить ваши документы перед запуском задачи, нажмите Просмотреть данные, чтобы отобразить образец данных.
    3. Нажмите Запустить. Документы передаются в векторную базу данных или на платформу данных в зависимости от конфигурации.

Передача завершена, когда кнопка Запуск активна.

Чтобы убедиться, что все было перенесено, вы можете задать вопросы о ваших данных. Для получения дополнительной информации см. раздел Использование помощника по проведению тестов.

Полная загрузка и захват изменений данных (CDC)

Полная загрузка и захват измененных данных поддерживаются.

Полная загрузка: Документ генерируется для каждого экземпляра документа и будет отправлен целевому объекту.

CDC: Документ регенерируется после любого изменения в базовой или связанной сущности.

Новый документ создается, когда запись добавляется в базовую сущность. Если никакие записи в связанных сущностях не могут быть связаны с базовой сущностью, они не появятся в документах.

Обновление входных данных

При обновлении входных данных необходимо запустить задачу данных для передачи изменений в векторную базу данных или платформу данных.

Имя индекса

Каждый маркет знаний имеет имя индекса, которое используется для семантического поиска.

Когда вы настраиваете задачи для записи в один и тот же индекс, вы должны настроить одни и те же параметры LLM для этих задач.

Если вы хотите, чтобы ваши документы находились в одном индексе, они должны иметь одинаковое имя индекса.

Чтобы изменить имя индекса:

  1. На странице задачи данных нажмите Настройки.
  2. Выберите вкладку Настройки векторной базы данных.
  3. Измените Имя индекса.
  4. Нажмите кнопку ОК.

Параметры

Можно просматривать и изменять параметры киоска базы знаний.

На странице Задача данных нажмите > Параметры.

Примечание к информацииПоскольку параметры зависят от хранилища (Databricks, Snowflake и т. п.), в следующих таблицах описаны параметры, которые всегда доступны. Могут быть доступны и другие параметры.
В этой таблице описаны параметры вкладки Подключения.
ПараметрыОписание
Подключение к источнику

Подключение к источнику.

Хранить векторы в

В раскрывающемся списке выберите:

  • Внешняя база данных векторов
  • Платформа проектов данных
Подключение к базе данных векторов

Этот параметр доступен, если для параметра Хранить векторы в выбрано значение Внешняя база данных векторов.

Подключение к базе данных векторов.

Для получения дополнительной информации см. раздел Подключение к базам данных векторов.

Подключение БЯМПодключение БЯМ.

Для получения дополнительной информации см. раздел Подключение к подключениям LLM.

Если в качестве подключения БЯМ необходимо использовать Databricks, настройте конечную точку обслуживания модели встраивания и конечную точку обслуживания модели завершения при создании киоска базы знаний. Для получения дополнительной информации см. документацию по Databricks.

В этой таблице описаны параметры вкладки Параметры платформы.
ПараметрыОписание
Схема задачи данныхИмя схемы задачи данных.
Внутренняя схемаИмя внутренней схемы.
Префикс для всех таблиц и видовПрефикс для разрешения конфликтов между несколькими задачами данных.
В этой таблице описаны параметры вкладки Настройки базы данных векторов.
ПараметрыОписание
Схема индекса

Этот параметр недоступен, если для параметра Хранить векторы в выбрано значение Внешняя база данных векторов.

Имя схемы индекса.
Имя индексаИмя индекса.
Если индекс уже существуетЕсли несколько задач записывают данные в один и тот же индекс, выберите, нужно ли удалять индекс:
  • Использовать существующий индекс: индекс не удаляется.
  • Отбросить и создать индекс. Индекс удаляется.
В этой таблице описаны параметры вкладки Время выполнения.
ПараметрыОписание
Параллельное выполнение

Максимальное количество подключений к базе данных. 

Введите значение от 1 до 50.

Массовый размерДля киосков баз знаний массовый размер — это количество документов, загружаемых в каждом массовом запросе.

Для киосков файловых баз знаний массовый размер — это количество файлов, загружаемых в каждом массовом запросе.

В Snowflake массовый размер не требуется, поскольку все загружается в одном запросе.

Максимальное количество записей для загрузки«0» означает, что все записи загружены.
В этой таблице описаны параметры вкладки Виды.
Параметры Описание
Стандартные виды Используйте стандартные виды для отображения результатов запроса в формате таблицы.
Защищенные виды Snowflake Используйте защищенные виды Snowflake для представления конфиденциальных данных или защищенной информации. В частности, такие виды могут создаваться, если требуется ограничить доступ к конфиденциальным данным и данные не должны быть видны пользователям, имеющим доступ к базовым таблицам.

Защищенные виды Snowflake могут выполняться медленнее, чем стандартные представления.

В этой таблице описаны параметры вкладки Помощник по тестированию.
ПараметрыОписание
Количество документов в контекстеКоличество релевантных документов, которые будут переданы в модель в качестве контекста.
Шаблон запросаВведите шаблон, которому ИИ должен следовать для фильтрации включаемых документов.
ФильтрВведите выражение для фильтрации включаемых документов.

Поскольку фильтр основан на метаданных, а файловые хранилища знаний не имеют метаданных, тщательно продумайте настраиваемый фильтр. Возможно, более целесообразно исключать данные, а не включать их.

Для получения дополнительной информации см. раздел Использование помощника по проведению тестов.

Получение документовВыберите параметр в раскрывающемся списке:
  • Показать извлеченный контекст: Помощник по тестированию предоставляет документы, на основе которых он генерирует ответ.
  • Не показывать извлеченный контекст: Помощник по тестированию генерирует ответ, но не предоставляет документы.
Создание ответовВыберите параметр в раскрывающемся списке:
  • Генерировать ответы: Помощник по тестированию генерирует ответ на основе документов.
  • Не генерировать ответы: Тестовый помощник отвечает только с помощью документов.

Помогла ли вам эта страница?

Если вы обнаружили какую-либо проблему на этой странице или с ее содержанием — будь то опечатка, пропущенный шаг или техническая ошибка, сообщите нам об этом!