Настройка экспериментов
Настройка экспериментов состоит из выбора целевого показателя и характеристик, которые модель будет использовать для его прогнозирования. Также можно настроить ряд дополнительных параметров.
Чтобы помочь вам в выборе целевого показателя, выполняется анализ исторического набора данных и отображается сводная статистика по каждому столбцу в наборе данных. К набору данных применяется несколько автоматических шагов предварительной обработки, чтобы гарантировать включение только подходящих данных. Для получения дополнительной информации о предварительной обработке данных см. Автоматическая подготовка и преобразование данных.
После запуска версии v1 при необходимости можно создать новые версии эксперимента для дальнейшей точной настройки обучения модели. Для получения дополнительной информации см. Улучшение моделей.
Требования и разрешения
Чтобы узнать больше о требованиях к пользователям для работы с экспериментами машинного обучения (ML), см. Работа с экспериментами.
Интерфейс
В следующих разделах описывается навигация по интерфейсу эксперимента для его настройки. Для получения дополнительной информации об интерфейсе см. Навигация по интерфейсу эксперимента.
Вкладки навигации
При создании эксперимента открывается вкладка Настройка. Здесь можно настроить целевой показатель и характеристики для эксперимента.
После запуска хотя бы одной версии эксперимента вкладка Настройка меняется на Данные обучения. Также становятся доступны другие вкладки. Эти вкладки позволяют анализировать модели, которые вы только что обучили в этой версии. Если вам нужно настроить последующие версии с другим выбором характеристик, вы можете вернуться на вкладку Данные обучения.
Представление схемы и Представление данных
На вкладке Настройка/Данные обучения можно переключаться между следующими представлениями:
-
Представление схемы: представление по умолчанию. В этом представлении каждый столбец в наборе данных представлен строкой в схеме с информацией и статистикой.
-
Представление данных: альтернативное представление, которое можно использовать для доступа к дополнительной информации и данным образца для каждого столбца.
Представление схемы в эксперименте ML

Представление данных в эксперименте ML

Панель настройки эксперимента
На панели настройки эксперимента можно дополнительно настроить обучение эксперимента. Эта панель открыта по умолчанию в новых экспериментах.
После запуска версии нажмите Просмотреть настройку, чтобы открыть панель для настройки следующей версии.
С помощью панели настройки эксперимента можно выполнять следующие действия:
-
Выберите целевой показатель и тип эксперимента
-
Задайте имя версии
-
Добавьте или удалите характеристики
-
Настройте новую версию эксперимента
-
Просмотрите тип обучаемой модели
-
Выберите, чтобы изменить или обновить обучающий набор данных
-
Добавьте или удалите алгоритмы
-
Измените настройки оптимизации модели
-
Для моделей временных рядов настройте параметры прогнозирования
-
Настройте обнаружение систематической ошибки
Панель настройки эксперимента

Выбор целевого показателя и типа эксперимента
Вы можете изменить целевой столбец и тип эксперимента до начала первого обучения. После этого они будут заблокированы для редактирования.
Целевой столбец содержит значения, которые должна прогнозировать модель машинного обучения.
Тип эксперимента определяется целевым показателем и типом содержащихся в нем данных. Тип эксперимента определяет тип модели, которую вы хотите обучить. Могут быть доступны следующие варианты:
-
Бинарная классификация: обучение моделей для прогнозирования целевого показателя, имеющего два возможных значения (например, «да» или «нет»). Данные могут быть любого типа характеристик.
-
Мультиклассовая классификация: обучение моделей для прогнозирования целевого показателя с 3–10 возможными значениями (например, список категорий). Данные могут быть любого типа характеристик, но столбец, содержащий более 10 уникальных нечисловых классов (значений), нельзя выбрать в качестве целевого показателя.
-
Регрессия: обучение моделей для прогнозирования целевого показателя с более чем 10 возможными значениями — в частности, целевого показателя с числовым типом характеристик.
-
Временные ряды: обучение моделей для прогнозирования целевых значений на определенные будущие периоды времени с использованием исторических данных. Целевой показатель должен иметь более 10 уникальных значений и содержать числовые данные. Для получения дополнительной информации см. Работа с экспериментами временных рядов.
Выполните следующие действия.
-
В
Представлении схемы или
Представлении данных наведите указатель мыши на столбец.
-
Нажмите на появившийся значок
.
Теперь целевой столбец обозначается значком
, а остальные доступные столбцы автоматически выбираются в качестве характеристик.
Выбор целевого показателя в Представлении схемы

-
На панели настройки эксперимента в разделе Параметры эксперимента при необходимости можно изменить целевой показатель перед обучением.
После выбора целевого показателя и типа эксперимента можно запустить первую версию эксперимента. Подробнее см. в разделе Обучение экспериментов. На этом этапе можно выполнить дополнительную настройку (описано ниже) или скорректировать настройку после просмотра результатов обучения.
По мере продолжения обучения эксперимента отображаются пояснения о том, как интерпретируются и обрабатываются ваши данные. Для получения дополнительной информации см. Интерпретация аналитических сведений о наборе данных.
Выбор столбцов характеристик
После выбора целевого показателя можно указать, какие из остальных доступных столбцов следует включить в обучение модели. Исключите любые характеристики, которые не должны входить в модель. Обратите внимание, что столбец останется в наборе данных, но не будет использоваться алгоритмом обучения.
В верхней части панели настройки эксперимента отображается количество ячеек в наборе данных. Если это число превышает лимит набора данных, можно исключить характеристики, чтобы не превышать лимит.
Выбрать столбцы характеристик можно разными способами:
В Представлении схемы и Представлении данных
В основных представлениях можно выполнять следующие действия:
-
Снимите флажок Включить все доступные характеристики, а затем выберите только те, которые необходимо включить.
-
Вручную снимите флажки для характеристик, которые не нужно включать.
-
Выполните поиск и исключите или включите все характеристики в отфильтрованном результате поиска.
На панели настройки эксперимента
На панели настройки эксперимента можно выполнять следующие действия:
-
Вручную снимите флажки для характеристик, которые не нужно включать.
-
После запуска первой версии эксперимента можно определить параметр Количество лучших характеристик для включения.
Раздел Характеристики на панели настройки эксперимента

При выборе характеристик им автоматически присваивается тип характеристики. Возможные типы характеристик:
-
Категориальный
-
Числовой
-
Дата
-
Свободный текст
Тип характеристики присваивается на основе данных, содержащихся в столбце характеристики. Если характеристика соответствует определенным критериям, она может быть выбрана в качестве основы для автоматически создаваемых характеристик. При желании можно изменить параметр использования характеристики для автоматического проектирования характеристик. Для получения подробной информации об автоматическом проектировании характеристик см. Автоматическое создание признаков.
Некоторые столбцы в наборе данных могут быть недоступны для выбора в качестве характеристик для эксперимента, или к ним может применяться специальная обработка. Пояснения о том, как интерпретируются и обрабатываются ваши данные, отображаются по мере навигации по обучению эксперимента. Для получения дополнительной информации см. Интерпретация аналитических сведений о наборе данных.
Настройка обнаружения предвзятости
Вы можете активировать обнаружение предвзятости для характеристик, содержащих конфиденциальные данные. Обнаружение предвзятости выполняется при запуске эксперимента. Вы также можете нажать Получить рекомендации, чтобы использовать генеративный ИИ для сканирования данных обучения на наличие потенциально конфиденциальных характеристик перед запуском обнаружения предвзятости.
Обнаружение предвзятости определяет, увеличивает ли характеристика вероятность того, что модель выдаст несправедливые результаты в своих прогнозах, или же исходные данные изначально предвзяты.
Выполните следующие действия.
-
В эксперименте машинного обучения разверните Смещение на панели конфигурации обучения.
-
Перед выбором признаков для обнаружения предвзятости, при необходимости нажмите Получить рекомендации, чтобы использовать генеративный ИИ для предложения признаков, которые могут содержать предвзятые данные. См. Использование генеративного ИИ для рекомендации характеристик для обнаружения предвзятости.
-
Выберите или отмените выбор любых признаков, для которых вы хотите запустить обнаружение предвзятости.
В качестве альтернативы включите обнаружение смещения для нужных функциональность, характеристики в представлении схемы.
Для получения дополнительной информации об обнаружении предвзятости см. Обнаружение предвзятости в моделях машинного обучения.
Выбор алгоритмов
Все доступные алгоритмы включены по умолчанию, и вы можете исключить любые алгоритмы, которые не хотите использовать. Обычно это делается в рамках точной настройки модели после просмотра первых результатов обучения. Подробнее см. в разделе Улучшение моделей.
Раздел Алгоритмы на панели настройки эксперимента
Изменение типов характеристик
При загрузке набора данных столбцы обрабатываются как категориальные, числовые, даты или свободный текст на основе типа данных и других характеристик. В некоторых случаях может потребоваться изменить этот параметр.
Например, если дни недели представлены числами 1–7, каждое число представляет собой категориальное значение. По умолчанию оно обрабатывается как непрерывное ранжированное числовое значение, поэтому вам потребуется вручную изменить конфигурацию, чтобы оно обрабатывалось как категориальное.
Когда столбец идентифицируется как содержащий информацию о дате и времени, он используется в качестве основы для новых автоматически создаваемых характеристик. В этом случае исходный столбец (родительская характеристика) обрабатывается как имеющий тип характеристики «Дата».
Вы можете изменить родительскую характеристику с характеристики даты на категориальную или числовую характеристику. Например, это полезно, когда характеристика идентифицируется как дата, но вам нужно, чтобы она обрабатывалась как строка или число. При этом вы больше не сможете использовать ее автоматически созданные характеристики при обучении эксперимента.
Выполните следующие действия.
-
В
Представлении схемы найдите характеристику.
-
В столбце Тип характеристики для этой характеристики нажмите
.
-
Выберите значение в списке.
Вы также можете изменить типы характеристик в Представлении данных. Найдите характеристику, затем нажмите
рядом с текущим типом характеристики. Выберите значение в списке.
Прогнозирование временных рядов
Если вы обучаете эксперимент с временными рядами, определенные преобразования типов характеристик применяются автоматически в зависимости от вашей конфигурации. Например, если вы выберете какие-либо группы для использования в многомерном прогнозировании, типы характеристик этих групп автоматически переключатся на категориальные.
Влияние на прогнозы
Когда тип признака меняется вручную, а затем выполняется развертывание полученной модели, переопределенный тип будет применен к признаку в наборе данных для применения, который будет использоваться в прогнозах, сделанных с помощью этой модели.
Изменение набора данных
Вы можете изменить обучающий набор данных как перед запуском первой версии эксперимента, так и после запуска любой версии.
Если вы измените набор данных перед запуском первой версии, вы потеряете все настройки, выполненные до изменения набора данных.
Выполните следующие действия.
-
На панели настройки эксперимента в разделе Данные обучения > Проверить набор данных нажмите Изменить набор данных.
-
Выберите новый набор данных.
Для получения дополнительной информации об изменении и обновлении набора данных во время точной настройки модели (после запуска версии эксперимента) см. Изменение и обновление набора данных.
Настройка оптимизации модели
Если ваш тип эксперимента — бинарная классификация, мультиклассовая классификация, или регрессия, вы можете настроить следующие параметры для оптимизации моделей:
-
Включение или выключение интеллектуальной оптимизации модели
-
Включение или выключение оптимизации гиперпараметров
-
Включение или выключение обучения с учетом фактора времени
Эти параметры можно включать или выключать для каждой запускаемой версии эксперимента.
Раздел Оптимизация модели на панели настройки эксперимента
Настройка интеллектуальной оптимизации
По умолчанию в эксперименте используется интеллектуальная оптимизация модели. При интеллектуальной оптимизации модели Qlik Predict берет на себя процесс точной настройки модели, выполняя итерации выбора характеристик и применяя расширенные преобразования к вашим данным.
Для получения дополнительной информации об интеллектуальной оптимизации см. Интеллектуальная оптимизация моделей.
Вы можете отключить этот параметр, чтобы вручную настраивать обучаемые модели. Например, вы можете начать обучение модели с интеллектуальной оптимизацией, а затем переключиться на ручную настройку для версии v2, чтобы дополнительно скорректировать конфигурацию.
Выполните следующие действия.
-
Нажмите
Просмотреть настройку.
-
Если вы уже запустили хотя бы одну версию эксперимента, нажмите Новая версия.
-
На панели разверните раздел Оптимизация модели.
-
Переключитесь с Интеллектуальная на Вручную.
-
С помощью ползунка установите максимальную продолжительность выполнения обучения.
Настройка оптимизации гиперпараметров
Вы можете оптимизировать модели с помощью оптимизации гиперпараметров. Обратите внимание, что это расширенный параметр, который может значительно увеличить время обучения. Оптимизация гиперпараметров доступна, если отключить интеллектуальную оптимизацию.
Для получения дополнительной информации см. Оптимизация гиперпараметров.
Выполните следующие действия.
-
Нажмите
Просмотреть настройку.
-
Если вы уже запустили хотя бы одну версию эксперимента, нажмите Новая версия.
-
На панели разверните раздел Оптимизация модели.
-
Переключитесь с Интеллектуальная на Вручную.
-
Установите флажок Оптимизация гиперпараметров.
-
При необходимости установите ограничение по времени для оптимизации. Ограничение по времени по умолчанию составляет один час.
Настройка обучения с учетом фактора времени
Если вы хотите, чтобы ваши модели обучались с учетом измерения временных рядов, активируйте обучение с учетом фактора времени для версии эксперимента. Чтобы использовать этот параметр, в вашем наборе данных должен быть столбец, содержащий соответствующую информацию о временных рядах.
Когда обучение с учетом фактора времени включено, Qlik Predict использует специализированные процессы перекрестной проверки и вменения пустых значений для обучения моделей.
Для получения дополнительной информации см. Создание моделей с учетом времени и Перекрестная проверка на основе времени.
Выполните следующие действия.
-
Нажмите
Просмотреть настройку.
-
Если вы уже запустили хотя бы одну версию эксперимента, нажмите Новая версия.
-
На панели разверните раздел Оптимизация модели.
-
В разделе Разделение на тестовую и обучающую выборки по времени выберите Индекс даты для сортировки данных.
Просмотр аналитики по данным обучения
На вкладке эксперимента Настройка/Данные обучения можно просматривать аналитику по обработке данных обучения. Эта информация доступна в столбце Аналитика в Представлении схемы. Отображаемая информация зависит от того, запускали ли вы версию с текущими данными обучения. Изменения в столбце Аналитика помогут определить, почему характеристики могут быть недоступны для использования или почему они были автоматически отброшены.
Для получения дополнительной информации о значении каждого аналитического вывода см. Интерпретация аналитических сведений о наборе данных.