Создание прогнозных данных
После развертывания и утверждения модели можно создавать прогнозирования на основе новых данных. При работе с этим учебным пособием мы создадим конфигурацию прогнозирования в рамках развертывания машинного обучения и используем ее для создания пакетного прогнозирования.
До этого мы использовали существующие данные клиентов для создания модели машинного обучения. Целью этого процесса является распознавание шаблонов посредством машинного обучения для их применения к новым данным.
Это также может применяться для анализа только значений SHAP в данных для обучения. Эта информация также очень полезна сама по себе.
Для получения дополнительной информации о работе с прогнозированиями в Qlik AutoML см. Создание прогнозирований на основе наборов данных.
Первым этапом процесса является выбор набора данных, к которому будет применяться модель для создания прогнозирований. После этого настраиваются необходимые свойства для вывода и создания файлов.
Выполните следующие действия.
В каталоге откройте новое развертывание машинного обучения.
-
В нижнем правом углу интерфейса развертывания машинного обучения щелкните Создать прогнозирование.
На панели Конфигурация прогнозирования справа в разделе Данные для применения щелкните Выбрать набор данных для применения.
Выберите файл набора данных для применения. Это может быть один из следующих файлов в зависимости от того, какой используется формат ― CSV или QVD:
AutoML Tutorial - Churn data - apply.csv
AutoML Tutorial - Churn data - apply.qvd
Сравните схемы обучения и наборы данных для применения. Так как во время обучения были исключены признаки, в наборе данных для применения будет больше полей, чем в наборе данных для обучения. Не стоит беспокоиться на этот счет. При создании прогнозов AutoML просто игнорирует поля из набора данных для применения, которые отсутствуют в наборе данных для обучения.
На панели Конфигурация прогнозирования нажмите Присвоить имя набору данных для прогнозирования. Введите имя для набора данных (или настройте использование имени по умолчанию) и выберите формат. По умолчанию используется Parquet, но в данном руководстве мы используем CSV.
Выберите пространство и нажмите Подтвердить.
В разделе Параметры прогнозирования настройте наборы данных, которые требуется создать с помощью данного прогнозирования. В этом случае подтвердите, что Coordinate SHAP ― единственный выбранный вариант. Разрешите использование AccountID в качестве столбца индекса.
Или щелкните значок рядом с кнопкой Сохранить и закрыть. Выберите Сохранить и создать прогноз сейчас.
Процесс можно контролировать на экране Прогнозирования по набору данных. Можно проверить вывод в каталоге, щелкнув Открыть во всплывающем окне.
По завершении процесса прогнозирования можно приступать к сборке приложения с новыми наборами данных. Переходите к следующему разделу.