Создание прогнозных данных
После развертывания и подтверждения модели можно создавать прогнозы по новым данным. При работе с этим учебным пособием мы создадим конфигурацию прогнозирования в рамках развертывания машинного обучения и используем ее для создания пакетного прогнозирования.
До этого мы использовали существующие данные клиентов для создания модели машинного обучения. Целью этого процесса является распознавание шаблонов посредством машинного обучения для их применения к новым данным.
Это также может применяться для анализа только значений SHAP в данных для обучения. Эта информация также очень полезна сама по себе.
Для получения дополнительной информации об использовании пакетного прогнозирования в Qlik Predict см. Создание прогнозов на наборах данных.
Первым этапом процесса является выбор набора данных, к которому будет применяться модель для создания прогнозирований. После этого настраиваются необходимые свойства для вывода и создания файлов.
Выполните следующие действия.
-
В каталоге откройте новое развертывание машинного обучения.
-
В правом нижнем углу нажмите Создать прогноз.
На панели Конфигурация прогнозирования справа в разделе Данные для применения щелкните Выбрать набор данных для применения.
Выберите файл набора данных для применения. Это может быть один из следующих файлов в зависимости от того, какой используется формат ― CSV или QVD:
ML - Churn data - apply.csv
ML - Churn data - apply.qvf
Сравните схемы обучения и наборы данных для применения. Так как во время обучения были исключены признаки, в наборе данных для применения будет больше полей, чем в наборе данных для обучения. Не стоит беспокоиться на этот счет. При генерации прогнозов Qlik Predict просто игнорирует поля из набора данных для применения, которые отсутствуют в обучающем наборе данных.
На панели Конфигурация прогнозирования нажмите Присвоить имя набору данных для прогнозирования. Введите следующее имя: ML - Prediction output. По умолчанию будет использоваться формат Parquet.
Выберите пространство и нажмите Подтвердить.
В разделе Параметры прогнозирования настройте дополнительные наборы данных, которые требуется создать с помощью данного прогнозирования. В этом случае подтвердите, что Coordinate SHAP ― единственный выбранный вариант. Разрешите использование AccountID в качестве столбца индекса.
Или щелкните значок рядом с кнопкой Сохранить и закрыть. Выберите Сохранить и создать прогноз сейчас.
Процесс можно контролировать на экране Прогнозирования по набору данных. Можно проверить вывод в каталоге, щелкнув Открыть во всплывающем окне.
По завершении процесса прогнозирования можно приступать к сборке приложения с новыми наборами данных. Переходите к следующему разделу.