Просмотр аналитических сведений о данных обучения
По мере добавления данных обучения и запуска версий обучения можно получать аналитические сведения о том, как обрабатываются данные. В столбце Аналитика предоставляется информация о целевом объекте и характеристиках в эксперименте, например о характеристиках, которые были исключены, недоступны или будут закодированы с помощью специальной обработки.
Столбец Аналитика находится в представлении Представление схемы на вкладке Конфигурация/Данные обучения. Сокращенные аналитические сведения также доступны в представлении
Представление данных. Аналитические сведения создаются индивидуально для каждой модели, обученной в рамках эксперимента.
Столбец Аналитика в представлении Представление схемы
Аналитические сведения создаются в следующих случаях:
-
После добавления или изменения данных обучения, но до запуска версий эксперимента.
-
После запуска каждой версии эксперимента. Для каждой обученной модели создается отдельный набор аналитических сведений.
Аналитические сведения могут отличаться до и после запуска версии. Это связано с тем, что при начале обучения Qlik Predict может выполнить предварительную обработку данных и дополнительно диагностировать проблемы с данными. Для получения дополнительной информации см. Автоматическая подготовка и преобразование данных.
Просмотр аналитических сведений перед обучением
Перед запуском версии эксперимента можно проанализировать столбец Аналитика, чтобы увидеть, как интерпретируются текущие данные обучения. Эти аналитические сведения могут измениться после запуска версии.
Выполните следующие действия.
-
В эксперименте убедитесь, что добавлены данные обучения, которые вы хотите использовать для версии эксперимента.
-
Откройте вкладку Конфигурация/Данные обучения.
-
Убедитесь, что вы находитесь в представлении
Представление схемы.
-
Проанализируйте столбец Аналитика. Всплывающие подсказки содержат дополнительный контекст для аналитических сведений. Дополнительные пояснения о значении каждого аналитического сведения см. в разделе Интерпретация аналитических сведений о наборе данных.
Просмотр аналитических сведений для модели
После завершения обучения моделей для версии эксперимента выберите модель и проверьте, как были обработаны данные.
Выполните следующие действия.
-
Запустите версию эксперимента, а затем откройте вкладку Конфигурация/Данные обучения.
-
Выберите модель из раскрывающегося списка на панели инструментов.
-
Убедитесь, что вы находитесь в представлении
Представление схемы.
-
Проанализируйте столбец Аналитика. Всплывающие подсказки содержат дополнительный контекст для аналитических сведений. Дополнительные пояснения о значении каждого аналитического сведения см. в разделе Интерпретация аналитических сведений о наборе данных.
Интерпретация аналитических сведений о наборе данных
В следующих таблицах приведена более подробная информация о возможных аналитических сведениях, которые могут отображаться в схеме.
Общие аналитические сведения
| Аналитическое сведение | Значение | Влияние на конфигурацию | Когда определяется аналитическое сведение | Дополнительные ссылки |
|---|---|---|---|---|
| Константа | Столбец имеет одинаковое значение для всех строк. | Столбец не может использоваться в качестве целевого объекта или включенной характеристики. | До и после запуска версии | Кардинальность |
| Кодирование One-hot | Тип характеристики является категориальным, и столбец содержит менее 14 уникальных значений. | Не влияет на конфигурацию. | До и после запуска версии | Категориальное кодирование |
| Кодирование Impact | Тип характеристики является категориальным, и столбец содержит 14 или более уникальных значений. | Не влияет на конфигурацию. | До и после запуска версии | Категориальное кодирование |
| Высокая кардинальность | Столбец содержит слишком много уникальных значений, что может негативно повлиять на производительность модели, если он используется в качестве характеристики. | Столбец не может использоваться в качестве целевого объекта. Он будет автоматически исключен как характеристика, но при необходимости его все равно можно включить. | До и после запуска версии | Кардинальность |
| Разреженные данные | Столбец содержит слишком много пустых значений (null). | Столбец не может использоваться в качестве целевого объекта или включенной характеристики. | До и после запуска версии | Подстановка нулей |
| Недостаточно представленный класс | Столбец содержит класс, в котором менее 10 строк. | Столбец не может использоваться в качестве целевого объекта, но может быть включен в качестве характеристики. | До и после запуска версии | - |
| Сбой преобразования характеристики | Тип характеристики был изменен вручную по сравнению с типом по умолчанию. При такой конфигурации произошла ошибка. | Версия эксперимента не может быть успешно запущена с этим преобразованием характеристики. Верните тип характеристики к прежнему значению или исключите характеристику из обучения. | После запуска версии | Изменение типов характеристик |
Аналитические сведения об автоматическом проектировании характеристик
| Аналитическое сведение | Значение | Влияние на конфигурацию | Когда определяется аналитическое сведение | Дополнительные ссылки |
|---|---|---|---|---|
| <число> автоматически спроектированных характеристик | Столбец является родительской характеристикой, которая может использоваться для создания автоматически спроектированных характеристик. | Если эта родительская характеристика интерпретируется как характеристика даты, она автоматически удаляется из конфигурации. Вместо этого рекомендуется использовать автоматически спроектированные характеристики даты, которые могут быть созданы на ее основе. Можно переопределить этот параметр и включить саму характеристику вместо автоматически спроектированных характеристик. | До и после запуска версии | Автоматическое создание признаков |
| Автоматически спроектированная характеристика | Столбец является автоматически спроектированной характеристикой, которая может быть или была создана на основе родительской характеристики даты. Она отсутствовала в исходном наборе данных. | Вы можете удалить одну или несколько из этих автоматически спроектированных характеристик во время обучения эксперимента. Если переключить тип родительской характеристики на категориальный, все автоматически спроектированные характеристики будут удалены. | До и после запуска версии | Автоматическое создание признаков |
| Не удалось обработать как дату | Столбец, возможно, содержит информацию о дате и времени, но не может быть использован для создания автоматически спроектированных характеристик даты. | Характеристика исключается из конфигурации. Если ранее на основе этой родительской характеристики были созданы автоматически спроектированные характеристики, они удаляются из будущих версий эксперимента. Вы по-прежнему можете использовать эту характеристику в эксперименте, но необходимо переключить ее тип на категориальный. | После запуска версии | Автоматическое создание признаков |
| Возможен свободный текст | Столбец может быть доступен для использования в качестве характеристики свободного текста. | Столбцу присваивается тип характеристики свободного текста. Необходимо запустить версию эксперимента, чтобы подтвердить, может ли характеристика обрабатываться как свободный текст. | Перед запуском версии | Автоматическое создание признаков |
| Свободный текст | Подтверждено, что столбец содержит свободный текст. Его можно обрабатывать как свободный текст. | Для этой характеристики не требуются дополнительные конфигурации. | После запуска версии | Автоматическое создание признаков |
| Не удалось обработать как свободный текст | При дальнейшем анализе выяснилось, что столбец не может быть обработан как свободный текст. | Необходимо отменить выбор характеристики в конфигурации для следующей версии эксперимента. Если характеристика не имеет высокой кардинальности, можно также изменить ее тип на категориальный. | После запуска версии | Автоматическое создание признаков |
Аналитические сведения об интеллектуальной оптимизации моделей
| Аналитическое сведение | Значение | Влияние на конфигурацию | Когда определяется аналитическое сведение | Дополнительные ссылки |
|---|---|---|---|---|
| Утечка целевого признака | Существует подозрение, что на характеристику влияет утечка целевого признака. В этом случае она содержит информацию о целевом столбце, значение которого вы пытаетесь спрогнозировать. Характеристики с утечкой целевого признака могут дать ложное ощущение уверенности в производительности модели. В реальных прогнозах они приводят к крайне низкой производительности модели. | Характеристика не использовалась для обучения модели. | После запуска версии | Утечка данных |
| Низкая важность перестановок | Характеристика оказывает незначительное влияние на прогнозы модели или не оказывает его вовсе. Удаление таких характеристик повышает производительность модели за счет снижения статистического шума. | Характеристика не использовалась для обучения модели. | После запуска версии | Общие сведения о важности перестановки |
| Высокая корреляция | Характеристика сильно коррелирует с одной или несколькими другими характеристиками в эксперементе. Наличие характеристик, которые сильно коррелируют друг с другом, снижает производительность модели. | Характеристика не использовалась для обучения модели. Характеристика, с которой она сильно коррелирует, не была исключена из-за высокой корреляции, но могла быть исключена по другой причине, например из-за низкой важности перестановок. | После запуска версии | Корреляция |
Аналитические сведения о прогнозировании временных рядов
| Аналитическое сведение | Значение | Влияние на конфигурацию | Когда определяется аналитическое сведение | Дополнительные ссылки |
|---|---|---|---|---|
| Возможный индекс даты | Характеристика может быть использована в качестве индекса даты для эксперимента с временными рядами. |
При использовании в качестве индекса даты временного ряда данные в столбце могут влиять на аспекты конфигурации временного ряда, например на то, насколько далеко в будущее можно делать прогноз. Значения в индексе даты должны увеличиваться с каждой строкой или уникальным значением группы с фиксированным интервалом времени. |
Перед запуском версии |
Аналитические сведения об обнаружении предвзятости
| Аналитическое сведение | Значение | Влияние на конфигурацию | Когда определяется аналитическое сведение | Дополнительные ссылки |
|---|---|---|---|---|
| Обнаружена предвзятость данных | Что касается значений в целевом столбце, некоторые группы (значения) недостаточно представлены по сравнению с другими. | Проанализируйте результаты обнаружения предвзятости, чтобы определить следующие шаги — они могут включать исключение характеристики, изменение набора данных или создание нового эксперимента с пересмотренной структурой. | После запуска версии | Обнаружение предвзятости в моделях машинного обучения |
| Обнаружена предвзятость представления | Обнаружена предвзятость в том, как обученная модель использует данные характеристики для создания прогнозов. | Проанализируйте результаты обнаружения предвзятости, чтобы определить следующие шаги — они могут включать исключение характеристики, изменение набора данных или создание нового эксперимента с пересмотренной структурой. | После запуска версии | Обнаружение предвзятости в моделях машинного обучения |