Перейти к основному содержимому Перейти к дополнительному содержимому

Создание прогнозирований на основе наборов данных

Используйте развертывание машинного обучения для прогнозирования будущих результатов на основе новых данных. При использовании пакетных прогнозирований создаются конфигурации прогнозирования в рамках развертывания машинного обучения, а затем они используются для создания прогнозирований в виде наборов данных. В созданных наборах данных каждая строка содержит прогнозируемое значение для этой конкретной строки. При работе с пакетными прогнозированиями создается прогноз для каждой строки в наборе данных для применения.

Чтобы приступить к созданию конфигураций прогнозирования, откройте развертывание машинного обучения и перейдите на панель Пакетные прогнозирования. См. раздел Навигация в интерфейсе развертывания машинного обучения.

При пакетном прогнозировании можно создавать прогнозирования на основе наборов данных в каталоге, например ежедневные прогнозирования по новым транзакциям. Прогнозирования также можно создавать в реальном времени с использованием конечной точки прогнозирования в реальном времени в Machine Learning API. Для получения информации о прогнозированиях в реальном времени см. раздел Создание прогнозирований в реальном времени.

Примечание к информации

API прогнозирования в реальном времени устарел и заменен конечной точкой прогнозирования в реальном времени в Machine Learning API. Сама функция сохранена. Для будущих сеансов прогнозирования в реальном времени используйте конечную точку прогнозирования в реальном времени в API машинного обучения.

Пакетные прогнозы генерируются в наборе данных с прогнозами и ― для моделей классификации ― со столбцом, содержащим значение вероятности каждого класса. Дополнительно также можно сгенерировать наборы данных со значениями SHAP или ошибками и копию набора данных для применения. Наборы данных могут иметь формат Parquet, CSV или QVD.

После создания прогнозирований данные прогнозной аналитики можно загрузить в приложение Qlik Sense, которое позволяет визуализировать данные, взаимодействовать с ними и создавать сценарии альтернатив.

Требования и разрешения

Для получения информации о необходимых разрешениях для работы с развертываниями машинного обучения или прогнозированиями см. раздел Работа с прогнозированиями с помощью машинного обучения.

Создание новых пакетных прогнозирований

Новые конфигурации прогнозирования можно создавать на панели Обзор развертывания, Развертываемые модели или Пакетные прогнозирования.

  1. Откройте развертывание машинного обучения из каталога.

  2. В правом нижнем углу нажмите Создать прогноз.

  3. В разделе Схема набора данных для применения нажмите Выбрать набор данных для применения.

  4. Выберите набор данных, для которого будут генерироваться предсказания, или нажмите кнопку Добавить набор данных для применения, чтобы загрузить новый набор данных. Для получения дополнительной информации о добавлении файлов данных Аналитика Qlik Cloud см. раздел Добавление новых файлов данных.

    Примечание к информацииНа этом этапе появится уведомление, если применяемая схема набора данных не совпадает со схемой модели. Для успешного прогнозирования схемы должны иметь одинаковые признаки и типы данных.
  5. Дополнительно можно присвоить конфигурации прогнозирования имя и добавить описание. На панели Конфигурация предсказания справа, в разделе Имя прогнозирования, отредактируйте Имя и Описание.

  6. По умолчанию конфигурация прогнозирования настроена на создание прогнозов с использованием модели по умолчанию в развертывании. В качестве альтернативы можно запустить прогнозирование из другой модели, используя псевдоним. На панели Конфигурация прогнозирования разверните список Выберите псевдоним модели и выберите псевдоним, который требуется использовать.

    Для получения дополнительной информации об использовании пакетного прогнозирования см. раздел Настройка псевдонимов моделей для пакетного прогнозирования.

  7. На панели Конфигурация прогнозирования в разделе Набор данных прогнозирования (вывод) щелкните Присвоить имя набору данных для прогнозирования.

  8. Введите имя (или оставьте имя по умолчанию).

    Qlik AutoML поддерживает динамическое именование файлов наборов данных для прогнозирования. Для получения дополнительной информации см. раздел Использование переменных в именах файлов наборов данных для прогнозирования.

  9. Выберите формат для создаваемых наборов данных. По умолчанию используется Parquet. Наборы данных также можно создавать в формате CSV или QVD.

  10. Выберите пространство.

  11. Щелкните Подтвердить.

  12. В пункте Параметры прогнозирования выберите любые дополнительные наборы данных, которые необходимо создать.

    • Набор данных для применения: создайте копию набора данных для применения, который будет использоваться для прогнозирования.

    • Набор данных Ошибки: создайте набор данных с ошибками для записей в наборе данных для применения. Это позволяет узнать, была ли запись удалена и по какой причине.

    • SHAP: создайте набор данных со значениями SHAP для каждой записи. Набор данных содержит столбцы index и <feature>_SHAP для каждого признака в модели.

      Примечание к информацииЭтот параметр недоступен для прогнозирований из моделей многоклассовой классификации. Вместо него для этих моделей можно использовать параметр Координатный SHAP.
    • Координатный SHAP: создайте набор данных со значениями SHAP для каждой записи. В наборе данных будут присутствовать те же самые значения, что и в наборе данных SHAP, но они будут организованы по-другому. Набор данных содержит столбцы index, automl_feature и SHAP_value. Дополнительный столбец, Predicted_class, включен в прогнозирования из модели многоклассовой классификации.

  13. В поле Столбец индекса выберите, будет ли столбец индекса создаваться автоматически или будет использоваться столбец, уже имеющийся в наборе данных для применения.

  14. Также можно воспользоваться возможностью прогнозирования по графику. В пункте График прогнозирования нажмите Создать график и настройте параметры в появившемся диалоговом окне. Для получения дополнительной информации см. раздел Создание графика прогнозирования.

  15. Нажмите кнопку Сохранить и закрыть, чтобы сохранить конфигурацию прогнозирования и вернуться к панели Пакетное прогнозирование, не запуская прогнозирование. Эта функция применяется, если требуется, чтобы прогнозирование выполнялось только по графику.

    Или щелкните значок Стрелка вниз рядом с кнопкой Сохранить и закрыть. Выберите Сохранить и создать прогноз сейчас. При этом сохраняется конфигурация прогнозирования и вручную запускается создание прогнозирования.

    Когда Последнее выполнение имеет значение Флажок, прогнозирование завершилось успешно.

  16. Перейдите в каталог, чтобы просмотреть созданные наборы данных.

Изменение конфигураций прогнозирования

Существующие конфигурации прогнозирования можно изменить на панели Пакетные прогнозирования.

  1. На панели Пакетные прогнозирования нажмите Дополнительные действия в конфигурации прогнозирования, которую необходимо изменить.

  2. Выберите Изменить конфигурацию прогнозирования в меню Действия.

  3. На панели Конфигурация прогнозирования можно изменить параметры, указанные ниже.

    • Имя прогнозирования: измените имя и описание конфигурации прогнозирования.

    • Владелец: назначьте себя владельцем конфигурации прогнозирования. Для получения информации о том, когда это может понадобиться, см. раздел Владение конфигурацией прогнозирования.

    • Выберите псевдоним модели: измените псевдоним модели, используемый для прогнозирования.

    • Данные для применения (ввод): можно изменить набор данных для применения.

    • Набор данных прогнозирования (вывод): можно изменить имя набора данных для прогнозирования и выбрать другое пространство.

    • Параметры прогнозирования: можно изменить свой выбор дополнительных наборов данных, которые будут созданы.

    • График прогнозирования: при необходимости можно установить график, по которому будет выполняться прогнозирование. Для получения дополнительной информации см. раздел Создание графика прогнозирования.

  4. Нажмите кнопку Сохранить и закрыть, чтобы сохранить конфигурацию прогнозирования и вернуться к панели Пакетное прогнозирование, не запуская прогнозирование.

    Или щелкните значок Стрелка вниз рядом с кнопкой Сохранить и закрыть. Выберите Сохранить и создать прогноз сейчас. При этом сохраняется конфигурация прогнозирования и вручную запускается создание прогнозирования.

    Когда в пункте Последнее состояние отображается «Успешно», создание прогнозирований завершено.

Запуск пакетного прогнозирования

Запустить прогнозирование для существующих конфигураций прогнозирования можно на панели Пакетные прогнозирования. Запуск процесса прогнозирования также может осуществляться по настраиваемому графику. Кроме того, у вас есть возможность комбинировать ручной запуск прогнозирования и запуск прогнозирования по графику с учетом своих потребностей.

Ручной запуск прогнозирования

Запуск конфигурации прогнозирования можно выполнить напрямую, выбрав соответствующий параметр в контекстном меню на панели Пакетные прогнозирования.

Чтобы запускать прогнозирование вручную, пользователь должен соответствовать требованиям для доступа к действию. См. раздел Владение конфигурацией прогнозирования.

  1. На панели Пакетные прогнозирования щелкните Дополнительные действия на конфигурации, которую необходимо использовать для прогнозирования.

  2. Выберите Запустить прогнозирование сейчас в меню Действия, чтобы запустить прогнозирование.

    Когда в пункте Последнее состояние отображается «Успешно», создание прогнозирований завершено.

Создание графика прогнозирования

Прогнозирование можно настроить на автоматический запуск по графику. Для каждой создаваемой конфигурации прогнозирования можно создать один график. Для этого войдите в меню График прогнозирования при создании или изменении конфигурации прогнозирования.

Для успешного выполнения графика прогнозирования владелец конфигурации прогнозирования должен иметь несколько необходимых для этого прав. В противном случае прогнозирование не может быть выполнено. Для получения дополнительной информации см. раздел Владение конфигурацией прогнозирования.

В диалоговом окне График прогнозирования можно задать следующие параметры графика.

  • Запустить прогнозирования: настройте общий график, по которому будет выполняться прогнозирование (ежедневно, еженедельно или ежемесячно). Установите интервал, день недели или день месяца в зависимости от выбранного графика.

  • Время: установите время запуска прогнозирования.

    Если в графике указано время (для ежедневного или еженедельного прогнозирования), то также можно установить время начала и окончания, между которыми будет выполняться прогнозирование.

  • Дата начала: установите дату, с которой график прогнозирования начнет действовать.

  • Дата окончания: установите дату, с которой прогнозирование перестанет выполняться по графику. По умолчанию прогнозирование будет выполняться по графику неограниченное время — до тех, пока не будет установлена дата окончания.

  • Выполнять, только если набор данных для применения изменился: если произойдет любое из следующих событий, запускается запланированное прогнозирование. В противном случае запланированное прогнозирование не запускается.

    • Обнаружено изменение в наборе данных для применения.

    • Модель, используемая в пакетном прогнозировании, изменилась, либо в результате изменения модели, назначенной текущему псевдониму, либо в результате изменения псевдонима, использующего другую модель.

Удаление конфигураций прогнозирования

Существующие конфигурации прогнозирования можно удалить на панели Пакетные прогнозирования.

  1. На панели Пакетные прогнозирования щелкните Дополнительные действия на конфигурации прогнозирования, которую необходимо удалить.

  2. Выберите Удалить конфигурацию прогнозирования в меню Действия.

  3. Нажмите Удалить, чтобы подтвердить удаление.

Ключевые понятия

Набор данных для применения

Во время обучения эксперимента выполняется развертывание модели, используемой для прогнозирования на основе нового набора данных. Этот набор данных называется набором данных для применения Прогнозирования создаются в наборе данных с прогнозированиями и — для моделей классификации — в столбце с вероятностью каждого класса. При необходимости также можно создать наборы данных со значениями SHAP или с ошибками.

Примечание к информации

Для использования в Qlik AutoML поддерживается любой неструктурированный файл, который можно загрузить и профилировать в Qlik Cloud.

Если файл содержит несколько таблиц, например файл Microsoft Excel с несколькими листами, будет импортирована только первая таблица. Если не удается выполнить профилирование данных таблицы (например, если таблица пуста), файл не поддерживается.

Набор данных для применения должен содержать те же признаки и типы данных, что и набор данных, используемый для обучения развертывания машинного обучения. Целевой столбец, указанный в эксперименте машинного обучения, не должен быть включен набор данных для применения. Обратите внимание, что в наборе данных для применения все еще могут присутствовать дополнительные столбцы, которые не использовались для обучения модели. При создании прогнозирований AutoML просто будет игнорировать дополнительные столбцы.

Конфигурация прогнозирования

Наборы данных прогнозирования создаются на основе конфигурации прогнозирования. Каждое развертывание машинного обучения может иметь несколько конфигураций прогнозирования. Конфигурацию прогнозирования можно настроить для выполнения по графику или без графика.

Владение конфигурацией прогнозирования

Когда пользователь создает конфигурацию прогнозирования, он автоматически назначается ее владельцем.

В следующем списке перечислены необходимые права доступа для выполнения конфигурации прогнозирования. Если прогнозирование запускается вручную, пользователь, выполняющий прогнозирование, должен удовлетворять этим требованиям. При работе с графиками прогнозирования владелец конфигурации прогнозирования должен соответствовать требованиям.

  • Право пользователя «Профессионал» или Full User и роль Automl Deployment Contributor в клиенте. См.: Кто может работать с Qlik AutoML

  • Необходимые разрешения в пространстве для запуска прогнозирования на основе развертывания машинного обучения.

  • Необходимые разрешения для создания источников данных в пространстве, в которое сохраняются данные прогнозирования.

Может произойти так, что владелец конфигурации прогнозирования потеряет доступ к клиенту или больше не будет соответствовать другим требованиям для работы с развертываниями машинного обучения. В таком случае пользователь с необходимыми разрешениями может щелкнуть Сделать меня владельцем, чтобы принять владение графиком прогнозирования и получить возможность запустить его выполнение. Это можно сделать на панели конфигурации прогнозирования или выполнить соответствующую операцию в окне Прогнозирования по набору данных.

Для получения информации о требуемых разрешениях в пространстве для выполнения действий, упомянутых в этом разделе, см. разделы Управление разрешениями в общих пространствах и Управление разрешениями в управляемых пространствах.

Активация модели

Прежде чем начать генерировать прогнозирования с помощью развертывания машинного обучения, необходимо активировать исходную модель. Для получения дополнительной информации см. раздел Утверждение развернутых моделей.

Автоматическое создание признаков

Для получения информации о создании прогнозов на основе моделей, обученных с помощью автоматического создания признаков, см. раздел Автоматическое создание признаков.

Замечания о наборах данных для применения

Влияние изменения типа признака вручную

Когда тип признака меняется вручную, а затем выполняется развертывание полученной модели, переопределенный тип будет применен к признаку в наборе данных для применения, который будет использоваться в прогнозах, сделанных с помощью этой модели.

Изменение типов признаков

Управление заданиями прогнозирования

Администраторы клиента могут останавливать или отменять задания прогнозирования в центре активности Администрирование. Для получения дополнительной информации см. раздел Управление Qlik AutoML.

Настройка уведомлений

Вы можете получать уведомления, когда прогнозирования создаются из развертывания машинного обучения. Для получения дополнительной информации см. раздел Настройка уведомлений для Qlik AutoML.

Просмотр сведений о дрейфе данных и событиях прогнозирования

После запуска прогнозирования переключитесь на панелиМониторинг дрейфа данных и Мониторинг операций, чтобы просмотреть следующие подробные сведения:

  • Уровень дрейфа данных для каждого признака в наборе данных для применения. Набор данных для применения сравнивается с набором данных для обучения.

  • Сведения о событии прогнозирования, например, выполнено успешно или нет, и сколько прогнозирований создано на его основе.

Для получения дополнительной информации см. раздел Мониторинг производительности и использования развернутых моделей.

Помогла ли вам эта страница?

Если вы обнаружили какую-либо проблему на этой странице и с ее содержанием — будь то опечатка, пропущенный шаг или техническая ошибка, сообщите нам об этом, чтобы мы смогли ее исправить!