Ingeniería automática de características
Con la ingeniería automática de características, Qlik Predict puede utilizar las características de sus datos de entrenamiento para crear características nuevas. Estas nuevas características generadas mediante ingeniería automática le permiten descubrir nuevos patrones en sus datos y pueden mejorar en gran medida el rendimiento de sus modelos de aprendizaje automático. Qlik Predict admite la ingeniería de características de fecha y la ingeniería de características de texto libre.
Fondo
La ingeniería de características es el proceso de crear nuevas columnas de características a partir de las actuales. Qlik Predict puede realizar la ingeniería de características automáticamente, para mejorar el tratamiento de determinados tipos de datos. Para obtener información general sobre ingeniería de características, vea Crear nuevas columnas de características.
Identificación de cuándo es posible la ingeniería automática de características
Después de seleccionar un conjunto de datos para utilizarlo en su experimento, se analiza el conjunto de datos y se identifica si las columnas que contiene contienen determinados tipos de datos. Estos tipos de datos permiten a Qlik Predict asignar un tipo de característica a cada columna del conjunto de datos. A cada columna se le asigna uno de los siguientes tipos de característica:
-
Categórica
-
Numérica
-
Fecha
-
Texto libre
Cuando es posible, Qlik Predict muestra una lista de características de ingeniería automática que pueden crearse a partir de características padre elegibles. Esta lista de características diseñadas automáticamente se va refinando y reduciendo a medida que comienza el preprocesamiento. Incluir características generadas mediante ingeniería automática en su experimento es recomendable, pero opcional. Puede eliminar características individuales generadas mediante ingeniería automática antes de iniciar el entrenamiento y al configurar cada nueva versión del experimento.
Para obtener más información sobre los procesos completados antes de que comience el entrenamiento del experimento, vea Preparación y transformación automática de los datos.
Ingeniería de características de fecha
Cuando se detectan columnas de fecha y fecha y hora en los datos de entrenamiento, se pueden crear automáticamente nuevas características de fecha a partir de estas columnas. Para más información, vea Ingeniería de características de fecha.
Manejo del texto libre
Se admite el manejo especial de datos de texto libre al entrenar modelos. Para más información, vea Manejo de los datos de texto libre.