Перейти к основному содержимому Перейти к дополнительному содержимому

Настройка экспериментов

Настройка экспериментов заключается в выборе цели и признаков, которые модель будет использовать для прогнозирования цели. Также можно настроить ряд дополнительных параметров.

В качестве помощи при выборе цели анализируется исторический набор данных и отображается сводная статистика для каждого столбца в наборе данных. К набору данных применяются несколько этапов автоматической предварительной обработки, чтобы убедиться, что он содержит только подходящие данные. Для получения дополнительной информации о предварительной обработке данных см. раздел Автоматическая подготовка и преобразование данных.

После выполнения v1 можно при необходимости создать новые версии эксперимента, чтобы дополнительно усовершенствовать обучение модели. Для получения дополнительной информации см. раздел Уточнение моделей.

Требования и разрешения

Для получения дополнительной информации о требованиях, предъявляемых к пользователю для работы с экспериментами машинного обучения, см. раздел Работа с экспериментами.

Интерфейс

В следующих разделах описывается порядок навигации по интерфейсу эксперимента для настройки конфигурации эксперимента. Для получения дополнительной информации об интерфейсе см. раздел Навигация в интерфейсе эксперимента.

Навигация по вкладкам

Когда создается эксперимент, открывается вкладка Данные. Здесь можно настроить цель и признаки для эксперимента.

После выполнения хотя бы одной версии эксперимента становятся доступными другие вкладки. Эти другие вкладки позволяют анализировать модели, только что обученные в версии. Если требуется настроить последующие версии, используя другие выборки признаков, можно вернуться на вкладку Данные.

Вид схемы и Вид данных

На вкладке Данные можно переключаться между следующими видами:

  • Строки Вид схемы: вид по умолчанию. В этом виде каждый столбец в наборе данных представлен строкой в схеме с информацией и статистикой.

  • Таблица Вид данных: это альтернативный вид, где можно просмотреть дополнительную информацию и образцы данных для каждого столбца.

Вид схемы в эксперименте машинного обучения

Вид схемы в эксперименте машинного обучения

Вид данных в эксперименте машинного обучения

Вид данных в эксперименте машинного обучения

Панель Конфигурация эксперимента

Щелкните Элементы управления Посмотреть конфигурацию, чтобы открыть панель, где можно дополнительно настроить обучение эксперимента. Панель можно открыть независимо от просматриваемой вкладки. Она содержит ряд дополнительных параметров конфигурации.

На панели конфигурации эксперимента доступны следующие действия:

  • Выберите цель и тип эксперимента

  • Добавьте или удалите признаки

  • Настройте новую версию эксперимента

  • Выберите изменение или обновление набора данных для обучения

  • Добавьте или удалите алгоритмы

  • Измените параметры оптимизации модели

  • Для моделей временных рядов задайте параметры прогноза

Панель Конфигурация эксперимента

Расширенная панель настройки в эксперименте машинного обучения

Выбор цели и типа эксперимента

Целевой столбец и тип эксперимента можно изменить до запуска первого обучения. После этого они будут заблокированы для редактирования.

Целевой столбец содержит значения, которые необходимо спрогнозировать с помощью модели машинного обучения.

Тип эксперимента определяется целью и типом данных, которые она содержит. Тип эксперимента определяет, какой тип модели вы хотите обучить. Могут быть доступны следующие параметры:

  • Бинарная классификация: Обучает модели для прогнозирования цели, которая имеет два возможных значения (например, да или нет). Данные могут быть любого типа признака.

  • Многоклассовая классификация: Обучает модели для прогнозирования цели с 3-10 возможными значениями (например, список категорий). Данные могут быть любого типа признака, но столбец, содержащий более 10 различных нечисловых классов (значений), нельзя выбрать в качестве цели.

  • Регрессия: Обучает модели для прогнозирования целевого значения с более чем 10 возможными значениями — в частности, целевого значения с числовым типом функциональности.

  • Временные ряды: Обучает модели для прогнозирования целевых значений для определенных будущих периодов времени, используя исторические данные. Целевое значение должно иметь более 10 различных значений и содержать числовой тип функциональности. Для получения дополнительной информации см. раздел Работа с экспериментами временных рядов.

  1. Открыв Строки Вид схемы или Таблица Вид данных, наведите указатель мыши на столбец.

  2. Щелкните появившийся значок Цель.

    Целевой столбец теперь обозначается значком Цель, а другие доступные столбцы выбираются автоматически в качестве признаков.

    Выбор цели в Виде схемы

    Столбец набора данных со значком цели.
  3. Щелкните Схема или Посмотреть конфигурацию, чтобы развернуть панель конфигурации эксперимента.

  4. Разверните Цель и тип эксперимента.

  5. Отображается Тип эксперимента. Если прогнозирование временных рядов возможно для вашего набора данных и цели, есть возможность изменить тип эксперимента с Регрессия на Временные ряды.

Когда выбраны цель и тип эксперимента, можно запустить первую версию эксперимента. Для получения дополнительной информации см. раздел Обучение экспериментов. На этом этапе можно выполнить дополнительную настройку, как описано ниже, или изменить конфигурацию после анализа результатов обучения.

Объяснения того, как интерпретируются и обрабатываются данные, отображаются по ходу обучения эксперимента. Для получения дополнительной информации см. раздел Интерпретация наблюдений для набора данных.

Выбор столбцов признаков

Определив цель, можно выбрать, какие из других доступных столбцов будут использоваться при обучении модели. Исключите все признаки, которые не должны присутствовать в модели. Обратите внимание, что столбцы исключенных признаков останутся в наборе данных, но не будут использоваться алгоритмом обучения.

Количество ячеек в наборе данных отображается в верхней части панели «Конфигурация эксперимента». Если количество превышает ограничение, установленное для набора данных, можно исключить признаки, чтобы предотвратить превышение ограничения.

Столбцы признаков можно выбрать различными способами.

В Виде схемы и Виде данных

В главных видах доступны следующие действия:

  • Снимите флажок Включить все доступные признаки, а затем выберите только те признаки, которые необходимо включить.

  • Вручную снимите флажки с тех признаков, которые не должны быть включены.

  • Выполните поиск, а затем исключите или включите все признаки в отфильтрованном результате поиска.

В панели «Конфигурация эксперимента»

Если развернута панель конфигурации эксперимента, доступны следующие действия.

  • Вручную снимите флажки с тех признаков, которые не должны быть включены.

  • После запуска первой версии эксперимента можно определить количество самых эффективных признаков для включения.

Раздел Признаки на панели конфигурации эксперимента

Раздел «Функции» в панели настройки обучения Qlik Predict

В процессе выбора признакам автоматически назначается тип. Возможные типы признаков:

  • Категориальный

  • Числовой

  • Дата

  • Произвольный текст

Тип признака назначается на основе данных, содержащихся в столбце признака. Если признак удовлетворяет определенным критериям, он может быть выбран в качестве основы для автоматически создаваемых признаков. При желании можно выбрать, должен ли признак использоваться для автоматического создания признаков. Для получения полных сведений об автоматическом создании признаков см. раздел Автоматическое создание признаков.

Некоторые столбцы в наборе данных могут быть недоступны для выбора в качестве признаков эксперимента, или к ним могут применяться специальные методы обработки. Объяснения того, как интерпретируются и обрабатываются данные, отображаются при навигации в рамках обучения эксперимента. Для получения дополнительной информации см. раздел Интерпретация наблюдений для набора данных.

Выбор алгоритмов

Все доступные алгоритмы включены по умолчанию, а алгоритмы, которые не будут использоваться, можно исключить. Как правило, это делается в процессе уточнения модели после получения первых результатов обучения. Для получения дополнительной информации см. раздел Уточнение моделей.

Раздел Алгоритмы на панели конфигурации эксперимента

Раздел «Алгоритмы» в панели настройки обучения Qlik Predict.

Изменение типов признаков

При загрузке набора данных столбцы определяются как категориальные или числовые признаки, признаки даты или произвольного текста в зависимости от типа данных и других характеристик. В некоторых случаях может возникнуть необходимость изменить этот параметр.

Например, если дни недели представлены числами от 1 до 7, то каждое число представляет собой категориальное значение. По умолчанию оно определяется как ранжированное числовое значение непрерывного параметра, поэтому необходимо вручную изменить конфигурацию, чтобы оно определялось как категориальное.

Когда столбец идентифицируется как содержащий информацию о дате и времени, он используется в качестве основы для автоматического создания новых признаков. Когда это происходит, исходный столбец (родительский признак) рассматривается как имеющий тип признака даты.

Для родительского признака можно назначить категориальный или числовой тип, вместо типа даты. Например, это полезно, когда признак определяется как дата, но его требуется обрабатывать как строку или число. Однако в таком случае будет невозможно использовать автоматически созданные признаки в обучении эксперимента.

  1. Откройте Вид схемы Строки и найдите.

  2. В столбце Тип признака для этого признака щелкните Стрелка вниз.

  3. Выберите значение в списке.

В качестве альтернативы типы признаков можно изменять в Таблица Виде данных. Найдите признак, затем щелкните Стрелка вниз рядом с текущим типом признака. Выберите значение в списке.

Все столбцы с измененным типом признака отображаются на панели конфигурации эксперимента в разделе Обработка данных.

Прогнозирование временных рядов

Если вы обучаете эксперимент временных рядов, определенные преобразования типов признаков применяются автоматически в зависимости от вашей конфигурации. Например, если вы выбираете какие-либо группы для использования в многомерном прогнозировании, типы признаков этих групп автоматически переключаются на категориальные.

Влияние на прогнозы

Когда тип признака меняется вручную, а затем выполняется развертывание полученной модели, переопределенный тип будет применен к признаку в наборе данных для применения, который будет использоваться в прогнозах, сделанных с помощью этой модели.

Изменение набора данных

Можно изменить набор данных для обучения перед выполнением первой версии эксперимента, а также после выполнения любой версии.

В случае изменения набора данных до выполнения первой версии будет потеряна любая конфигурация, настроенная до изменения набора данных.

  1. В разделе Данные для обучения на панели конфигурации эксперимента нажмите Изменить набор данных.

  2. Выберите новый набор данных.

Для получения дополнительной информации об изменении и обновлении набора данных во время доработки модели (после выполнения версии эксперимента) см. Изменение или обновление набора данных.

Настройка оптимизации модели

Если ваш тип экспериментабинарная классификация, многоклассовая классификация или регрессия, вы можете настроить следующие параметры для оптимизации ваших моделей:

  • Включение или выключение интеллектуальной оптимизации модели

  • Включение и выключение оптимизации гиперпараметров

  • Включение или выключение обучения с учетом времени

Эти параметры можно включать и выключать для каждой выполняемой версии эксперимента.

Настройка интеллектуальной оптимизации

По умолчанию в эксперименте используется интеллектуальная оптимизация. Благодаря интеллектуальной оптимизации моделей Qlik Predict выполняет процесс уточнения модели автоматически, итерационно меняя выборку признаков и применяя расширенные преобразования к данным.

Для получения дополнительной информации об интеллектуальной оптимизации см. раздел Интеллектуальная оптимизация модели.

Этот параметр можно отключить, чтобы уточнять обучаемые модели вручную. Например, может потребоваться начать обучение модели с интеллектуальной оптимизацией, а затем переключиться в ручной режим уточнения для версии 2, чтобы дополнительно настроить конфигурацию.

  1. Щелкните Элементы управления Посмотреть конфигурацию.

  2. Если уже выполнена хотя бы одна версия эксперимента, нажмите Новая версия.

  3. На панели разверните пункт Оптимизация модели.

  4. Переключитесь из режима Интеллектуальная в режим Ручная.

  5. С помощью ползунка установите максимум продолжительности обучения.

Настройка оптимизации модели

Активация интеллектуальной оптимизации модели в разделе «Оптимизация модели» на панели настройки обучения Qlik Predict

Настройка оптимизации гиперпараметров

Модели можно улучшать путем оптимизации гиперпараметров. Обратите внимание, что это дополнительная опция, которая может значительно увеличить время обучения. Оптимизация гиперпараметров доступна, если выключена интеллектуальная оптимизация.

Для получения дополнительной информации см. раздел Оптимизация гиперпараметров.

  1. Щелкните Элементы управления Посмотреть конфигурацию.

  2. Если уже выполнена хотя бы одна версия эксперимента, нажмите Новая версия.

  3. На панели разверните пункт Оптимизация модели.

  4. Переключитесь из режима Интеллектуальная в режим Ручная.

  5. Установите флажок в поле Оптимизация гиперпараметров.

  6. При необходимости установите ограничение по времени для оптимизации. По умолчанию ограничение по времени составляет один час.

Настройка оптимизации гиперпараметров

Панель настройки обучения Qlik Predict с активной оптимизацией гиперпараметров

Конфигурация обучения с учетом времени

Если требуется, чтобы модели обучались с учетом измерения временных рядов, активируйте обучение с учетом времени для версии эксперимента. Для использования этого параметра необходимо, чтобы в наборе данных был столбец, содержащий соответствующую информацию о временном ряде.

Когда включено обучение с учетом времени, Qlik Predict использует специализированные процессы перекрестной проверки и подстановки нулевых значений для обучения моделей.

Для получения дополнительной информации см. разделы Создание моделей с учетом времени и Перекрестная проверка на основе времени.

  1. Щелкните Элементы управления Посмотреть конфигурацию.

  2. Если уже выполнена хотя бы одна версия эксперимента, нажмите Новая версия.

  3. На панели разверните пункт Оптимизация модели.

  4. В разделе Разделение данных на тестирование и обучение на основе времени выберите Индекс даты, который будет использоваться для сортировки данных.

Настройте обучение с учетом времени, выбрав в данных для обучения столбец, который будет использоваться в качестве индекса.

Панель настройки обучения Qlik Predict с выбранным столбцом даты для активации обучения по времени.

Просмотр наблюдений о данных для обучения

На вкладке Данные эксперимента можно просматривать наблюдения об обработке данных для обучения. Эта информация доступна в столбце Наблюдения в Строки таблицы Виде схемы. Отображаемая информация зависит от того, выполнялась ли версия с использованием текущих данных для обучения. Изменения в столбце Наблюдения могут помочь определить, почему признаки могут быть недоступны для использования или почему они автоматически отброшены.

Для получения дополнительной информации о значении каждого наблюдения см. раздел Интерпретация наблюдений для набора данных.

СОПУТСТВУЮЩИЕ УЧЕБНЫЕ МАТЕРИАЛЫ:

Подробнее

Помогла ли вам эта страница?

Если вы обнаружили какую-либо проблему на этой странице или с ее содержанием — будь то опечатка, пропущенный шаг или техническая ошибка, сообщите нам об этом!