Перейти к основному содержимому Перейти к дополнительному содержимому

Создание прогнозирований на основе наборов данных

Используйте развертывание машинного обучения для прогнозирования будущих результатов на основе новых данных. При использовании пакетных прогнозирований создаются конфигурации прогнозирования в рамках развертывания машинного обучения, а затем они используются для создания прогнозирований в виде наборов данных. В созданных наборах данных каждая строка содержит прогнозируемое значение для этой конкретной строки. При работе с пакетными прогнозированиями создается прогноз для каждой строки в наборе данных для применения.

Чтобы приступить к созданию конфигураций прогнозирования, откройте развертывание машинного обучения и перейдите на панель Прогнозирования по набору данных. См. Навигация в интерфейсе развертывания машинного обучения.

При пакетном прогнозировании можно создавать прогнозирования на основе наборов данных в каталоге, например ежедневные прогнозирования по новым транзакциям. Прогнозирования также можно создавать в реальном времени с использованием конечной точки прогнозирования в реальном времени в Machine Learning API. Для получения информации о прогнозированиях в реальном времени см. раздел Создание прогнозирований в реальном времени.

Примечание к информации

API прогнозирования в реальном времени устарел и заменен конечной точкой прогнозирования в реальном времени в Machine Learning API. Сама функция сохранена. Для будущих сеансов прогнозирования в реальном времени используйте конечную точку прогнозирования в реальном времени в API машинного обучения.

Прогнозирования создаются в наборе данных с прогнозированиями и — для моделей классификации — в столбце с вероятностью каждого класса. При необходимости также можно создать наборы данных со значениями SHAP и копию набора данных для применения. Наборы данных могут иметь формат Parquet, CSV или QVD.

После создания прогнозирований данные прогнозной аналитики можно загрузить в приложение Qlik Sense, которое позволяет визуализировать данные, взаимодействовать с ними и создавать сценарии альтернатив.

Перед началом работы

Прежде чем начать генерировать прогнозирования с помощью развертывания машинного обучения, необходимо активировать исходную модель. Для получения дополнительной информации см. раздел Утверждение развернутых моделей.

Ключевые понятия

Набор данных для применения

Во время обучения эксперимента выполняется развертывание модели, используемой для прогнозирования на основе нового набора данных. Этот набор данных называется набором данных для применения Прогнозирования создаются в наборе данных с прогнозированиями и — для моделей классификации — в столбце с вероятностью каждого класса. При необходимости также можно создать наборы данных со значениями SHAP или с ошибками.

Примечание к информации

Для использования в Qlik AutoML поддерживается любой неструктурированный файл, который можно загрузить и профилировать в Qlik Cloud.

Если файл содержит несколько таблиц, например файл Microsoft Excel с несколькими листами, будет импортирована только первая таблица. Если не удается выполнить профилирование данных таблицы (например, если таблица пуста), файл не поддерживается.

Набор данных для применения должен содержать те же признаки и типы данных, что и набор данных, используемый для обучения развертывания машинного обучения. Целевой столбец, указанный в эксперименте машинного обучения, не должен быть включен набор данных для применения. Обратите внимание, что в наборе данных для применения все еще могут присутствовать дополнительные столбцы, которые не использовались для обучения модели. При создании прогнозирований AutoML просто будет игнорировать дополнительные столбцы.

Конфигурация прогнозирования

Наборы данных прогнозирования создаются на основе конфигурации прогнозирования. Каждое развертывание машинного обучения может иметь несколько конфигураций прогнозирования. Конфигурацию прогнозирования можно настроить для выполнения по графику или без графика.

Владение конфигурацией прогнозирования

Когда пользователь создает конфигурацию прогнозирования, он автоматически назначается ее владельцем.

В следующем списке перечислены необходимые права доступа для выполнения конфигурации прогнозирования. Если прогнозирование запускается вручную, пользователь, выполняющий прогнозирование, должен удовлетворять этим требованиям. При работе с графиками прогнозирования владелец конфигурации прогнозирования должен соответствовать требованиям.

  • Право пользователя «Профессионал» или Full User и роль Automl Deployment Contributor в клиенте. См.: Кто может работать с Qlik AutoML

  • Необходимые разрешения в пространстве для запуска прогнозирования на основе развертывания машинного обучения.

  • Необходимые разрешения для создания источников данных в пространстве, в которое сохраняются данные прогнозирования.

Может произойти так, что владелец конфигурации прогнозирования потеряет доступ к клиенту или больше не будет соответствовать другим требованиям для работы с развертываниями машинного обучения. В таком случае пользователь с необходимыми разрешениями может щелкнуть Сделать меня владельцем, чтобы принять владение графиком прогнозирования и получить возможность запустить его выполнение. Это можно сделать на панели конфигурации прогнозирования или выполнить соответствующую операцию в окне Прогнозирования по набору данных.

Для получения информации о требуемых разрешениях в пространстве для выполнения действий, упомянутых в этом разделе, см. разделы Управление разрешениями в общих пространствах и Управление разрешениями в управляемых пространствах.

Автоматическое создание признаков

Для получения информации о создании прогнозов на основе моделей, обученных с помощью автоматического создания признаков, см. раздел Автоматическое создание признаков.

Замечания о наборах данных для применения

Влияние изменения типа признака вручную

Когда тип признака меняется вручную, а затем выполняется развертывание полученной модели, переопределенный тип будет применен к признаку в наборе данных для применения, который будет использоваться в прогнозах, сделанных с помощью этой модели.

Изменение типов признаков

Требования и разрешения

Для получения информации о необходимых разрешениях для работы с развертываниями машинного обучения или прогнозированиями см. раздел Работа с прогнозированиями с помощью машинного обучения.

Создание новых пакетных прогнозирований

Новые конфигурации прогнозирования можно создавать как на панели Обзор развертывания, так и на панели Прогнозирования по набору данных.

  1. Откройте развертывание машинного обучения из каталога.

  2. В правом нижнем углу нажмите Создать прогноз.

  3. На панели Конфигурация прогнозирования разверните пункт Данные для применения и нажмите Выбрать набор данных для применения.

  4. Выберите набор данных для создания прогнозирований. Набор данных должен содержать те же признаки и типы данных, что и схема модели.

    Наборы данных можно загружать через страницу «Создать» в центре активности Аналитика и просматривать в каталоге. Новый набор данных также можно загрузить непосредственно в каталог со страницы выбора наборов данных для прогнозов. Затем этот набор данных будет автоматически выбран в качестве набора данных для применения, который будет использоваться в прогнозировании. Для этого нажмите Добавить набор данных для применения и выберите файл для загрузки.

  5. В пункте Набор данных для прогнозирования нажмите Присвоить имя набору данных для прогнозирования.

  6. Введите имя (или оставьте имя по умолчанию).

    Qlik AutoML поддерживает динамическое именование файлов наборов данных для прогнозирования. Для получения дополнительной информации см. раздел Использование переменных в именах файлов наборов данных для прогнозирования.

  7. Выберите формат для создаваемых наборов данных. По умолчанию используется Parquet. Наборы данных также можно создавать в формате CSV или QVD.

  8. Выберите пространство.

  9. Щелкните Подтвердить.

  10. В пункте Параметры прогнозирования выберите любые дополнительные наборы данных, которые необходимо создать.

    • Набор данных Ошибки: создайте набор данных с ошибками для записей в наборе данных для применения. Это позволяет узнать, была ли запись удалена и по какой причине.

    • SHAP: создайте набор данных со значениями SHAP для каждой записи. Набор данных содержит столбцы index и <feature>_SHAP для каждого признака в модели.

      Примечание к информацииЭтот параметр недоступен для прогнозирований из моделей многоклассовой классификации. Вместо него для этих моделей можно использовать параметр Координатный SHAP.
    • Координатный SHAP: создайте набор данных со значениями SHAP для каждой записи. В наборе данных будут присутствовать те же самые значения, что и в наборе данных SHAP, но они будут организованы по-другому. Набор данных содержит столбцы index, automl_feature и SHAP_value. Дополнительный столбец, Predicted_class, включен в прогнозирования из модели многоклассовой классификации.

  11. Выберите, будет ли столбец индекса создаваться автоматически или будет использоваться столбец, уже имеющийся в наборе данных для применения.

  12. Также можно воспользоваться возможностью прогнозирования по графику. В пункте График прогнозирования нажмите Создать график и настройте параметры в появившемся диалоговом окне. Для получения дополнительной информации см. раздел Создание графика прогнозирования.

  13. Нажмите кнопку Сохранить и закрыть, чтобы сохранить конфигурацию прогнозирования и вернуться к панели Прогнозирования по набору данных, не запуская прогнозирование. Эта функция применяется, если требуется, чтобы прогнозирование выполнялось только по графику.

    Или щелкните значок Стрелка вниз рядом с кнопкой Сохранить и закрыть. Выберите Сохранить и создать прогноз сейчас. При этом сохраняется конфигурация прогнозирования и вручную запускается создание прогнозирования.

    Когда в пункте Последнее состояние отображается «Успешно», создание прогнозирований завершено.

  14. Перейдите в каталог, чтобы просмотреть созданные наборы данных.

Изменение конфигураций прогнозирования

Существующие конфигурации прогнозирования можно изменить на панели Прогнозирования по набору данных.

  1. На панели Прогнозирования по набору данных нажмите ... в конфигурации прогнозирования, которую необходимо изменить.

  2. Выберите Изменить конфигурацию прогнозирования в меню Действия.

  3. На панели Конфигурация прогнозирования можно изменить параметры, указанные ниже.

    • Данные для применения: вы можете изменить набор данных для применения.

    • Набор данных для прогнозирования: можно изменить имя набора данных для прогнозирования и выбрать другое пространство.

    • Параметры прогнозирования: можно изменить свой выбор дополнительных наборов данных, которые будут созданы.

    • График прогнозирования: при необходимости можно установить график, по которому будет выполняться прогнозирование. Для получения дополнительной информации см. раздел Создание графика прогнозирования.

  4. Нажмите кнопку Сохранить и закрыть, чтобы сохранить конфигурацию прогнозирования и вернуться к панели Прогнозирование по набору данных, не запуская прогнозирование.

    Или щелкните значок Стрелка вниз рядом с кнопкой Сохранить и закрыть. Выберите Сохранить и создать прогноз сейчас. При этом сохраняется конфигурация прогнозирования и вручную запускается создание прогнозирования.

    Когда в пункте Последнее состояние отображается «Успешно», создание прогнозирований завершено.

Запуск пакетного прогнозирования

Запустить прогнозирование для существующих конфигураций прогнозирования можно на панели Прогнозирования по набору данных. Запуск процесса прогнозирования также может осуществляться по настраиваемому графику. Кроме того, у вас есть возможность комбинировать ручной запуск прогнозирования и запуск прогнозирования по графику с учетом своих потребностей.

Ручной запуск прогнозирования

Запуск конфигурации прогнозирования можно выполнить напрямую, выбрав соответствующий параметр в контекстном меню на панели Прогнозирования по набору данных.

Чтобы запускать прогнозирование вручную, пользователь должен соответствовать требованиям для доступа к действию. См. Владение конфигурацией прогнозирования.

  1. На панели Прогнозирования по набору данных нажмите ... в конфигурации прогнозирования, которую необходимо запустить.

  2. Выберите Запустить прогнозирование сейчас в меню Действия, чтобы запустить прогнозирование.

    Когда в пункте Последнее состояние отображается «Успешно», создание прогнозирований завершено.

Создание графика прогнозирования

Прогнозирование можно настроить на автоматический запуск по графику. Для каждой создаваемой конфигурации прогнозирования можно создать один график. Для этого войдите в меню График прогнозирования при создании или изменении конфигурации прогнозирования.

Для успешного выполнения графика прогнозирования владелец конфигурации прогнозирования должен иметь несколько необходимых для этого прав. В противном случае прогнозирование не может быть выполнено. Для получения дополнительной информации см. раздел Владение конфигурацией прогнозирования.

В диалоговом окне График прогнозирования можно задать следующие параметры графика.

  • Запустить прогнозирования: настройте общий график, по которому будет выполняться прогнозирование (ежедневно, еженедельно или ежемесячно). Установите интервал, день недели или день месяца в зависимости от выбранного графика.

  • Время: установите время запуска прогнозирования.

    Если в графике указано время (для ежедневного или еженедельного прогнозирования), то также можно установить время начала и окончания, между которыми будет выполняться прогнозирование.

  • Дата начала: установите дату, с которой график прогнозирования начнет действовать.

  • Дата окончания: установите дату, с которой прогнозирование перестанет выполняться по графику. По умолчанию прогнозирование будет выполняться по графику неограниченное время — до тех, пока не будет установлена дата окончания.

  • Выполнять, только если набор данных для применения изменился: запланированное прогнозирование не будет выполняться, если с момента последнего запуска набор данных для применения не изменился. Этот параметр можно отключить, если запланированное прогнозирование должно выполняться всегда, независимо от изменений в наборе данных.

Удаление конфигураций прогнозирования

Существующие конфигурации прогнозирования можно удалить на панели Прогнозирования по набору данных.

  1. На панели Прогнозирования по набору данных нажмите ... в конфигурации прогнозирования, которую необходимо удалить.

  2. Выберите Удалить конфигурацию прогнозирования в меню Действия.

  3. Нажмите Удалить, чтобы подтвердить удаление.

Управление заданиями прогнозирования

Администраторы клиента могут останавливать или отменять задания прогнозирования в центре активности Администрирование. Для получения дополнительной информации см. раздел Управление Qlik AutoML.

Настройка уведомлений

Вы можете получать уведомления, когда прогнозирования создаются из развертывания машинного обучения. Для получения дополнительной информации см. раздел Настройка уведомлений для Qlik AutoML.

Просмотр сведений о дрейфе данных и событиях прогнозирования

После того выполнения прогнозирования, переключитесь на панель Мониторинг дрейфа данных, чтобы просмотреть следующие подробные сведения:

  • Уровень дрейфа данных для каждого признака в наборе данных для применения. Набор данных для применения сравнивается с набором данных для обучения.

  • Сведения о событии прогнозирования, например, выполнено успешно или нет, и сколько прогнозирований создано на его основе.

Для получения дополнительной информации см. раздел Мониторинг производительности и использования развернутых моделей.

Подробнее

Помогла ли вам эта страница?

Если вы обнаружили какую-либо проблему на этой странице и с ее содержанием — будь то опечатка, пропущенный шаг или техническая ошибка, сообщите нам об этом, чтобы мы смогли ее исправить!