Создание прогнозных данных
После развертывания и утверждения модели можно создавать прогнозы на основе новых данных.
До этого мы использовали существующие данные клиентов для создания модели машинного обучения. Целью этого процесса является распознавание шаблонов посредством машинного обучения для их применения к новым данным.
Это также может применяться для анализа только значений SHAP в данных для обучения. Эта информация также очень полезна сама по себе.
Для получения дополнительной информации о работе с прогнозированиями в Qlik AutoML см. Создание прогнозов на основе наборов данных.
Первым этапом процесса является выбор набора данных, к которому будет применяться модель для создания прогнозирований. После этого настраиваются необходимые свойства для вывода и создания файлов.
Выполните следующие действия.
В каталоге откройте новое развертывание машинного обучения.
-
В нижнем правом углу интерфейса развертывания машинного обучения щелкните Создать прогнозирование.
-
Щелкните , чтобы открыть панель Конфигурация прогнозирования, если она не отображается.
-
Затем необходимо выбрать набор данных для применения. В области Данные для применения щелкните Выбрать набор данных для применения.
-
Выберите файл набора данных для применения. Это может быть один из следующих файлов в зависимости от того, какой используется формат ― CSV или QVD:
-
AutoML Tutorial - Churn data - apply.csv
-
AutoML Tutorial - Churn data - apply.qvd
-
-
Сравните схемы обучения и наборы данных для применения. Так как во время обучения были исключены признаки, в наборе данных для применения будет больше полей, чем в наборе данных для обучения. Не стоит беспокоиться на этот счет. При создании прогнозов AutoML просто игнорирует поля из набора данных для применения, которые отсутствуют в наборе данных для обучения.
-
На панели Конфигурация прогнозирования нажмите Присвоить имя набору данных для прогнозирования. Введите имя для набора данных (или настройте использование имени по умолчанию) и выберите формат. По умолчанию используется Parquet, но в данном руководстве мы используем CSV.
-
Выберите пространство и нажмите Подтвердить.
-
В разделе Параметры прогнозирования настройте наборы данных, которые требуется создать с помощью данного прогнозирования. В этом случае подтвердите, что Coordinate SHAP ― единственный выбранный вариант. Разрешите использование AccountID в качестве столбца индекса.
Щелкните Сохранить и создать прогноз сейчас. Процесс можно контролировать на экране Прогнозирования по набору данных.
Можно проверить вывод в каталоге, щелкнув Открыть во всплывающем окне.
По завершении процесса прогнозирования можно приступать к сборке приложения с новыми наборами данных. Переходите к следующему разделу.