Перейти к основному содержимому Перейти к дополнительному содержимому

Создание прогнозов на основе наборов данных

Используйте развертывание машинного обучения для прогнозирования будущих результатов на основе новых данных.

Чтобы приступить к созданию конфигураций прогнозирования, откройте развертывание машинного обучение и перейдите на панель Прогноз по набору данных. См. Навигация в интерфейсе развертывания машинного обучения.

Прогнозы можно создавать на основе наборов данных из каталога, как, например, ежедневные прогнозы по новым транзакциям. Кроме того, прогнозы можно генерировать в реальном времени с помощью API прогнозирования. Для получения дополнительной информации об API прогнозирования см. раздел Создание прогнозов в реальном времени.

Прогнозы генерируются в наборе данных с прогнозами и — для моделей классификации — в столбце с вероятностью каждого класса. При необходимости также можно создать наборы данных со значениями SHAP и копию набора данных для применения. Наборы данных могут иметь формат Parquet, CSV или QVD.

После создания прогнозов данные прогнозной аналитики можно загрузить в приложение Qlik Sense, которое позволяет визуализировать данные, взаимодействовать с ними и создавать сценарии альтернатив.

Перед началом работы

Прежде чем начать генерировать прогнозы с помощью развертывания машинного обучения, необходимо активировать исходную модель. Для получения дополнительной информации см. раздел Утверждение развернутых моделей.

Ключевые понятия

Набор данных для применения

Во время обучения эксперимента выполняется развертывание модели, используемой для прогнозирования на основе нового набора данных. Этот набор данных называется набором данных для применения Прогнозы генерируются в наборе данных с прогнозами и — для моделей классификации — в столбце с вероятностью каждого класса. При необходимости также можно создать наборы данных со значениями SHAP или с ошибками.

Примечание к информации

Для использования в Qlik AutoML поддерживается любой неструктурированный файл, который можно загрузить и профилировать в Qlik Cloud.

Если файл содержит несколько таблиц, например файл Microsoft Excel с несколькими листами, будет импортирована только первая таблица. Если не удается выполнить профилирование данных таблицы (например, если таблица пуста), файл не поддерживается.

Набор данных для применения должен содержать те же признаки и типы данных, что и набор данных, используемый для обучения развертывания машинного обучения. Целевой столбец, указанный в эксперименте машинного обучения, не должен быть включен набор данных для применения. Обратите внимание, что в наборе данных для применения все еще могут присутствовать дополнительные столбцы, которые не использовались для обучения модели. При создании прогнозов AutoML просто будет игнорировать дополнительные столбцы.

Автоматическое создание признаков

Для получения информации о создании прогнозов на основе моделей, обученных с помощью автоматического создания признаков, см. раздел Автоматическое создание признаков.

Конфигурация прогнозирования

Наборы данных прогнозирования создаются на основе конфигурации прогнозирования. Каждое развертывание машинного обучения может иметь несколько конфигураций прогнозирования. Конфигурацию прогнозирования можно настроить для выполнения по графику или без графика.

Владение конфигурацией прогнозирования

Когда пользователь создает конфигурацию прогнозирования, он автоматически назначается ее владельцем.

В следующем списке перечислены необходимые права доступа для выполнения конфигурации прогнозирования. Если прогнозирование запускается вручную, пользователь, выполняющий прогнозирование, должен удовлетворять этим требованиям. При работе с графиками прогнозирования владелец конфигурации прогнозирования должен соответствовать требованиям.

  • Право пользователя «Профессионал» или Full User и роль Automl Deployment Contributor в клиенте. См.: Кто может работать с Qlik AutoML

  • Необходимые разрешения в пространстве для запуска прогнозирования на основе развертывания машинного обучения.

  • Необходимые разрешения для создания источников данных в пространстве, в которое сохраняются данные прогнозирования.

Может произойти так, что владелец конфигурации прогнозирования потеряет доступ к клиенту или больше не будет соответствовать другим требованиям для работы с развертываниями машинного обучения. В таком случае пользователь с необходимыми разрешениями может щелкнуть Сделать меня владельцем, чтобы принять владение графиком прогнозирования и получить возможность запустить его выполнение. Это можно сделать на панели конфигурации прогнозирования или выполнить соответствующую операцию в окне Прогноз по набору данных.

Для получения информации о требуемых разрешениях в пространстве для выполнения действий, упомянутых в этом разделе, см. разделы Управление разрешениями в общих пространствах и Управление разрешениями в управляемых пространствах.

Замечания о наборах данных для применения

Влияние изменения типа признака вручную

Когда тип признака меняется вручную, а затем выполняется развертывание полученной модели, переопределенный тип будет применен к признаку в наборе данных для применения, который будет использоваться в прогнозах, сделанных с помощью этой модели.

Изменение типов признаков

Требования и разрешения

Для получения информации о необходимых разрешениях для работы с развертываниями машинного обучения или прогнозами см. раздел Работа с прогнозированиями с помощью машинного обучения.

Создание новых прогнозов

Новые прогнозы можно создавать как на панели Обзор развертывания, так и на панели Прогноз по набору данных.

  1. Откройте развертывание машинного обучения из каталога.

  2. В правом нижнем углу нажмите Создать прогноз.

  3. На панели Конфигурация прогнозирования разверните пункт Данные для применения и нажмите Выбрать набор данных для применения.

  4. Выберите набор данных для создания прогнозов. Набор данных должен содержать те же признаки и типы данных, что и схема модели.

    Наборы данных можно загружать через страницу «Создать» в центре активности Аналитика и просматривать в каталоге. Новый набор данных также можно загрузить непосредственно в каталог со страницы выбора наборов данных для прогнозов. Затем этот набор данных будет автоматически выбран в качестве набора данных для применения, который будет использоваться в прогнозировании. Для этого нажмите Добавить набор данных для применения и выберите файл для загрузки.

  5. В пункте Набор данных для прогнозирования нажмите Присвоить имя набору данных для прогнозирования.

  6. Введите имя (или оставьте имя по умолчанию).

    Qlik AutoML поддерживает динамическое именование файлов наборов данных для прогнозирования. Для получения дополнительной информации см. раздел Использование переменных в именах файлов наборов данных для прогнозирования.

  7. Выберите формат для создаваемых наборов данных. По умолчанию используется Parquet. Наборы данных также можно создавать в формате CSV или QVD.

  8. Выберите пространство.

  9. Щелкните Подтвердить.

  10. В пункте Параметры прогнозирования выберите любые дополнительные наборы данных, которые необходимо создать.

    • Набор данных Ошибки: создайте набор данных с ошибками для записей в наборе данных для применения. Это позволяет узнать, была ли запись удалена и по какой причине.

    • SHAP: создайте набор данных со значениями SHAP для каждой записи. Набор данных содержит столбцы index и <feature>_SHAP для каждого признака в модели.

      Примечание к информацииЭтот параметр недоступен для прогнозов из моделей многоклассовой классификации. Вместо него для этих моделей можно использовать параметр Координатный SHAP.
    • Координатный SHAP: создайте набор данных со значениями SHAP для каждой записи. В наборе данных будут присутствовать те же самые значения, что и в наборе данных SHAP, но они будут организованы по-другому. Набор данных содержит столбцы index, automl_feature и SHAP_value. Дополнительный столбец, Predicted_class, включен в прогнозы из модели многоклассовой классификации.

  11. Выберите, будет ли столбец индекса создаваться автоматически или будет использоваться столбец, уже имеющийся в наборе данных для применения.

  12. Также можно воспользоваться возможностью прогнозирования по графику. В пункте График прогнозирования нажмите Создать график и настройте параметры в появившемся диалоговом окне. Для получения дополнительной информации см. раздел Создание графика прогнозирования.

  13. Нажмите кнопку Сохранить и закрыть, чтобы сохранить конфигурацию прогнозирования и вернуться к панели Прогнозы на основе набора данных, не запуская прогнозирование. Эта функция применяется, если вы хотите, чтобы прогнозирование выполнялось только по графику.

    Либо нажмите Сохранить и создать прогноз сейчас, чтобы сохранить конфигурацию прогнозирования и запустить прогнозирование вручную.

    Когда в пункте Последнее состояние отображается «Успешно», создание прогнозов завершено.

  14. Перейдите в каталог, чтобы просмотреть созданные наборы данных.

Изменение конфигураций прогнозирования

Существующие конфигурации прогнозирования можно изменить на панели Прогнозы на основе набора данных.

  1. На панели Прогнозы на основе набора данных нажмите ... в конфигурации прогнозирования, которую необходимо изменить.

  2. Выберите Изменить конфигурацию прогнозирования в меню Действия.

  3. На панели Конфигурация прогнозирования можно изменить параметры, указанные ниже.

    • Данные для применения: вы можете изменить набор данных для применения.

    • Набор данных для прогнозирования: можно изменить имя набора данных для прогнозирования и выбрать другое пространство.

    • Параметры прогнозирования: можно изменить свой выбор дополнительных наборов данных, которые будут созданы.

    • График прогнозирования: при необходимости можно установить график, по которому будет выполняться прогнозирование. Для получения дополнительной информации см. раздел Создание графика прогнозирования.

  4. Нажмите кнопку Сохранить и закрыть, чтобы сохранить конфигурацию прогнозирования и вернуться к панели Прогнозы на основе набора данных, не запуская прогнозирование.

    Либо нажмите Сохранить и создать прогноз сейчас, чтобы сохранить конфигурацию прогнозирования и запустить прогнозирование вручную.

    Когда в пункте Последнее состояние отображается «Успешно», создание прогнозов завершено.

Запуск прогнозирования

Запустить прогнозирование для существующих конфигураций прогнозирования можно на панели Прогнозы на основе набора данных. Запуск процесса прогнозирования также может осуществляться по настраиваемому графику. Кроме того, у вас есть возможность комбинировать ручной запуск прогнозирования и запуск прогнозирования по графику с учетом своих потребностей.

Ручной запуск прогнозирования

Запуск конфигурации прогнозирования можно выполнить напрямую, выбрав соответствующий параметр в контекстном меню на панели Прогнозы на основе набора данных.

Чтобы запускать прогнозирование вручную, пользователь должен соответствовать требованиям для доступа к действию. См. Владение конфигурацией прогнозирования.

  1. На панели Прогнозы на основе набора данных нажмите ... в конфигурации прогнозирования, которую вы хотите запустить.

  2. Выберите Запустить прогнозирование сейчас в меню Действия, чтобы запустить прогнозирование.

    Когда в пункте Последнее состояние отображается «Успешно», создание прогнозов завершено.

Создание графика прогнозирования

Прогнозирование можно настроить на автоматический запуск по графику. Для каждой создаваемой конфигурации прогнозирования можно создать один график. Для этого войдите в меню График прогнозирования при создании или изменении конфигурации прогнозирования.

Для успешного выполнения графика прогнозирования владелец конфигурации прогнозирования должен иметь несколько необходимых для этого прав. В противном случае прогнозирование не может быть выполнено. Для получения дополнительной информации см. раздел Владение конфигурацией прогнозирования.

В диалоговом окне График прогнозирования можно задать следующие параметры графика.

  • Запустить прогнозирования: настройте общий график, по которому будет выполняться прогнозирование (ежедневно, еженедельно или ежемесячно). Установите интервал, день недели или день месяца в зависимости от выбранного графика.

  • Время: установите время запуска прогнозирования.

    Если в графике указано время (для ежедневного или еженедельного прогнозирования), то также можно установить время начала и окончания, между которыми будет выполняться прогнозирование.

  • Дата начала: установите дату, с которой график прогнозирования начнет действовать.

  • Дата окончания: установите дату, с которой прогнозирование перестанет выполняться по графику. По умолчанию прогнозирование будет выполняться по графику неограниченное время — до тех, пока не будет установлена дата окончания.

  • Выполнять, только если набор данных для применения изменился: запланированное прогнозирование не будет выполняться, если с момента последнего запуска набор данных для применения не изменился. Этот параметр можно отключить, если запланированное прогнозирование должно выполняться всегда, независимо от изменений в наборе данных.

Удаление конфигураций прогнозирования

Существующие конфигурации прогнозирования можно удалить на панели Прогнозы на основе набора данных.

  1. На панели Прогнозы на основе набора данных нажмите ... в конфигурации прогнозирования, которую необходимо удалить.

  2. Выберите Удалить конфигурацию прогнозирования в меню Действия.

  3. Нажмите Удалить, чтобы подтвердить удаление.

Управление заданиями прогнозирования

Администраторы клиента могут останавливать или отменять задания прогнозирования в центре активности Администрирование. Для получения дополнительной информации см. раздел Управление Qlik AutoML.

Настройка уведомлений

Вы можете получать уведомления, когда прогнозы создаются из развертывания машинного обучения. Для получения дополнительной информации см. раздел Настройка уведомлений для Qlik AutoML.

Просмотр сведений о дрейфе данных и событиях прогнозирования

После того выполнения прогнозирования, переключитесь на панель Мониторинг дрейфа данных, чтобы просмотреть следующие подробные сведения:

  • Уровень дрейфа данных для каждого признака в наборе данных для применения. Набор данных для применения сравнивается с набором данных для обучения.

  • Сведения о событии прогнозирования, например, выполнено успешно или нет, и сколько прогнозов создано на его основе.

Для получения дополнительной информации см. раздел Мониторинг производительности и использования развернутых моделей.

Подробнее

Помогла ли вам эта страница?

Если вы обнаружили какую-либо проблему на этой странице и с ее содержанием — будь то опечатка, пропущенный шаг или техническая ошибка, сообщите нам об этом, чтобы мы смогли ее исправить!