Автоматическое создание признаков
Благодаря функции автоматического создания признаков Qlik Predict может создавать новые признаки, используя существующие признаки в тренировочных данных. Такие новые автоматически созданные признаки позволяют выявлять новые шаблоны в данных и могут значительно улучшить производительность моделей машинного обучения. Qlik Predict поддерживает проектирование характеристик даты и проектирование характеристик свободного текста.
Фон
Создание признаков — это процесс создания новых столбцов признаков на основе существующих. Qlik Predict может автоматически создавать признаки для улучшенной обработки определенных типов данных. Для получения общих сведений о создании признаков см. раздел Создание новых столбцов признаков.
Определение возможности автоматического проектирования характеристик
После выбора набора данных для использования в эксперименте выполняется анализ этого набора, и содержащиеся в нем столбцы идентифицируются как содержащие те или иные типы данных. Эти типы данных позволяют Qlik Predict назначить тип признака каждому столбцу в наборе данных. Каждому столбцу присваивается один из следующих типов признака:
-
Категориальный
-
Числовой
-
Дата
-
Произвольный текст
Когда возможно, Qlik Predict отображает список признаков, которые можно автоматически создать на основе удовлетворяющих критериям родительских признаков. Этот список автоматически созданных признаков дополнительно уточняется и сокращается после начала предварительной обработки. Включение автоматически созданных признаков в эксперимент рекомендуется, но не является обязательным. Можно удалять отдельные автоматически созданные признаки перед началом обучения и при настройке конфигурации каждой новой версии эксперимента.
Для получения дополнительной информации о процессах, завершенных до начала обучения эксперимента, см. раздел Автоматическая подготовка и преобразование данных.
Создание признаков даты
Когда в обучающих данных обнаруживаются столбцы даты и времени, из этих столбцов могут быть автоматически созданы новые характеристики даты. Для получения дополнительной информации см. раздел Создание признаков даты.
Обработка свободного текста
Специальная обработка данных свободного текста поддерживается при обучении моделей. Для получения дополнительной информации см. раздел Обработка данных произвольного текста.