Saltar al contenido principal Saltar al contenido complementario

Crear predicciones sobre conjuntos de datos

Utilice su implementación de ML para predecir resultados futuros de nuevos datos.

Para empezar a crear configuraciones de predicción, abra una implementación de ML y vaya al panel Predicciones del conjunto de datos. Vea Navegar por la interfaz de implementación de ML.

Puede hacer predicciones sobre conjuntos de datos del catálogo, por ejemplo, predicciones diarias sobre nuevas transacciones. Las predicciones también se pueden hacer en tiempo real usando la API de predicción. Para obtener información sobre la API de predicción, consulte Crear predicciones en tiempo real.

Las predicciones se generan en un conjunto de datos con predicciones y, para los modelos de clasificación, una columna con la probabilidad de cada clase. Opcionalmente también puede generar conjuntos de datos con valores SHAP o errores y una copia del conjunto de datos de aplicación. Los conjuntos de datos pueden estar en formato Parquet, CSV o QVD.

Cuando se generan predicciones, puede cargar la información predictiva en una app de Qlik Sense. Esto le permite visualizar e interactuar con los datos y crear escenarios hipotéticos.

Antes de comenzar:

Antes de que pueda empezar a generar predicciones con su implementación de ML, es necesario activar el modelo de origen. Para más información, vea Aprobar los modelos implementados.

Conceptos clave

Conjunto de datos de aplicación

Durante el entrenamiento de experimentos, implementará un modelo que se utiliza para generar predicciones en un nuevo conjunto de datos. Este conjunto de datos se conoce como el conjunto de datos de aplicación. Las predicciones se generan en un conjunto de datos con predicciones y, para los modelos de clasificación, una columna con la probabilidad de cada clase. Si lo prefiere, también puede generar conjuntos de datos con valores SHAP o errores.

Nota informativa

Cualquier archivo sin formato que se pueda cargar y perfilar en Qlik Cloud se admite para su uso en Qlik AutoML.

Con archivos de varias tablas, como archivos de Microsoft Excel con varias hojas, solo se importará la primera tabla. Si la generación de perfiles de datos falla para una tabla (por ejemplo, si está vacía), el archivo no es compatible.

El conjunto de datos de aplicación debe tener las mismas características y tipos de datos que el conjunto de datos utilizado para entrenar la implementación de ML. No es necesario incluir la columna objetivo especificada en el experimento de ML en el conjunto de datos de aplicación. Tenga en cuenta que las columnas adicionales que no formaban parte del entrenamiento del modelo aún pueden estar presentes en el conjunto de datos de aplicación. AutoML simplemente ignorará las columnas adicionales al generar predicciones.

Ingeniería automática de características

Para obtener información sobre cómo generar predicciones con modelos entrenados mediante ingeniería automática de características, consulte Ingeniería automática de características.

Configuración de la predicción

Los conjuntos de datos de predicción se generan a partir de una configuración de predicción. Cada implementación de ML puede tener múltiples configuraciones de predicción. La configuración de predicción se puede configurar para que se ejecute con o sin programación.

Propiedad de la configuración de predicción

Cuando un usuario crea una configuración de predicción, se le asigna automáticamente como propietario.

La siguiente lista indica los requisitos de acceso para que se ejecute una configuración de predicción. Si la predicción se ejecuta manualmente, el usuario que ejecuta las predicciones debe cumplir los requisitos. Para las predicciones programadas, el propietario de la configuración de predicción debe cumplir los requisitos.

  • Los roles de Derecho Profesional o Full User y Automl Deployment Contributor en el espacio empresarial inquilino. Vea: Quién puede trabajar con Qlik AutoML

  • Los permisos necesarios en el espacio para ejecutar predicciones desde la implementación de ML.

  • Los permisos necesarios para crear fuentes de datos en el espacio donde se guardan los datos de predicción.

Podría suceder que el propietario de una configuración de predicción pierda el acceso al espacio inquilino o ya no cumpla con los demás requisitos para trabajar con implementaciones de ML. En ese caso, un usuario con los permisos necesarios puede hacer clic en Hazme propietario para tomar posesión de la predicción programada y poder ejecutarla. Esto se hace en el panel de configuración de predicción o como una acción en la ventana de Predicciones del conjunto de datos.

Para obtener información sobre los requisitos de permisos de espacio para cualquiera de las acciones mencionadas en esta sección, consulte Administrar permisos en espacios compartidos y Gestionar permisos en espacios administrados.

Consideraciones para aplicar conjuntos de datos

Impacto de cambiar manualmente el tipo de característica

Cuando cambie manualmente el tipo de función de una característica y, a continuación, implemente un modelo resultante, las modificaciones del tipo de característica se aplicarán a la característica en el conjunto de datos de aplicación que se utilice en las predicciones realizadas con ese modelo.

Cambiar los tipos de características

Requisitos y permisos

Para obtener información sobre los requisitos de permisos para trabajar con implementaciones y predicciones de ML, consulte Trabajar con predicciones de ML.

Crear nuevas predicciones

Puede crear nuevas configuraciones de predicción tanto desde el panel Vista general de la implementación como desde el panel Predicciones del conjunto de datos.

  1. Abrir una Implementación de ML desde el catálogo.

  2. En la parte inferior derecha, haga clic en Crear predicción.

  3. En el panel Configuración de la predicción, expanda Aplicar datos y haga clic en Seleccionar el conjunto de datos de aplicación.

  4. Seleccione un conjunto de datos para generar predicciones. El conjunto de datos debe tener las mismas características y tipos de datos que el Esquema del modelo.

    Los conjuntos de datos pueden cargarse a través de la página Crear del centro de actividades Analítica. También puede cargar un nuevo conjunto de datos directamente en el Catálogo desde la página de selección de conjuntos de datos de predicción. Este conjunto de datos se seleccionará automáticamente como el conjunto de datos de aplicación para usar en su predicción. Para ello, haga clic en Agregar conjunto de datos de aplicación y elija el archivo que desee cargar.

  5. En Conjunto de datos de predicción, haga clic en Conjunto de datos de predicción de nombres.

  6. Escriba un nombre (o acepte el nombre predeterminado).

    Qlik AutoML admite nombres de archivos dinámicos para conjuntos de datos de predicción. Para más información, vea Uso de variables en nombres de archivos de conjuntos de datos de predicción.

  7. Seleccione un formato para los conjuntos de datos generados. El valor predeterminado es Parquet. Los conjuntos de datos también pueden generarse en formato CSV o QVD.

  8. Seleccione un espacio.

  9. Haga clic en Confirmar.

  10. En Opciones de predicción, seleccione cualquier conjunto de datos adicional que desee generar.

    • Errores: genere un conjunto de datos con errores para los registros en el conjunto de datos de aplicación. Esto le permite saber si se eliminó un registro y por qué motivo.

    • SHAP: genere un conjunto de datos con valores SHAP para cada registro. El conjunto de datos tiene las columnas index y <feature>_SHAP para cada característica del modelo.

      Nota informativaEsta opción no está disponible para predicciones de modelos de clasificación multiclase. Para estos modelos, puede utilizar la opción SHAP de coordenadas en su lugar.
    • SHAP de coordenadas: genere un conjunto de datos con valores SHAP para cada registro. Esto le da los mismos valores que el conjunto de datos SHAP pero organizado de una manera diferente. El conjunto de datos tiene las columnas index, automl_feature y SHAP_value. Se incluye una columna adicional, Predicted_class, con predicciones de un modelo de clasificación multiclase.

  11. Elija si desea generar automáticamente una columna de índice o usar una columna actual del conjunto de datos de aplicación.

  12. También es posible que desee ejecutar su predicción conforme a un horario o programación. En Programación de predicción, haga clic en Crear programación y ajuste la configuración en el cuadro de diálogo que aparece. Para más información, vea Programación de predicciones.

  13. Haga clic en el botón Guardar y cerrar para guardar su configuración de predicción y volver al panel de Predicciones del conjunto de datos sin ejecutar la predicción. Es posible que prefiera esta opción si solo desea que las predicciones se ejecuten según una programación.

    Como alternativa, haga clic en Guardar y predecir ahora para guardar la configuración de predicción y ejecutar la predicción manualmente.

    Cuando el Último estado muestra "Correcto", las predicciones están listas.

  14. Vaya al Catálogo para ver los conjuntos de datos generados.

Editar las configuraciones de predicción

Puede editar las configuraciones de predicción existentes desde el panel de Predicciones del conjunto de datos.

  1. En el panel Predicciones del conjunto de datos, haga clic en ... en la configuración de la predicción que desee editar.

  2. Seleccione Editar configuración de la predicción desde el menú Acciones.

  3. En el panel Configuración de la predicción, puede editar las siguientes secciones:

    • Aplicar datos: puede cambiar el conjunto de datos de aplicación.

    • Conjunto de datos de predicción: puede cambiar el nombre y el espacio del conjunto de datos de predicción.

    • Opciones de predicción: puede cambiar sus selecciones para los conjuntos de datos adicionales que se generan.

    • Programación de predicción: si lo desea, puede establecer el horario en el que se ejecutará su predicción. Para más información, vea Programación de predicciones.

  4. Haga clic en el botón Guardar y cerrar para guardar su configuración de predicción y volver al panel de Predicciones del conjunto de datos sin ejecutar la predicción.

    Como alternativa, haga clic en Guardar y predecir ahora para guardar la configuración de predicción y ejecutar la predicción manualmente.

    Cuando el Último estado muestra "Correcto", las predicciones están listas.

Ejecutar predicciones

Puede ejecutar las predicciones según las actuales configuraciones de predicción desde el panel Predicciones del conjunto de datos. Alternativamente, es posible que desee ejecutar sus predicciones de acuerdo con una programación personalizable. Puede combinar ejecuciones manuales y programadas de sus predicciones para adaptarse mejor a sus necesidades.

Ejecutar las predicciones manualmente

Puede comenzar a ejecutar una configuración de predicción directamente seleccionando la opción dentro de un menú contextual en el panel Predicciones del conjunto de datos.

Para que un usuario ejecute una predicción manualmente, ese usuario debe cumplir con los requisitos de acceso para la acción. Vea Propiedad de la configuración de predicción.

  1. En el panel Predicciones del conjunto de datos, haga clic en ... en la configuración de predicción para la que desea ejecutar predicciones.

  2. Seleccione Ejecutar predicciones ahora en el menú Acciones para comenzar a generar predicciones.

    Cuando el Último estado muestra "Correcto", las predicciones están listas.

Programación de predicciones

Las predicciones se pueden configurar para que se ejecuten automáticamente conforme a un horario programado. Puede crear una programación para cada configuración de predicción que cree. Acceda al menú Programación de predicción al crear o editar una configuración de predicción.

Para que una predicción programada se ejecute correctamente, el propietario de la configuración de predicción debe cumplir varios requisitos de permiso. De lo contrario, la predicción no se podrá ejecutar. Para más información, vea Propiedad de la configuración de predicción.

El cuadro de diálogo Programación de predicción le permite especificar los siguientes parámetros para su calendario:

  • Ejecutar predicciones: ajuste la programación general conforme a la cual se ejecutará la predicción (diaria, semanal o mensual). Establezca el intervalo, el día de la semana o el día del mes según su selección.

  • Hora: configure la hora del día en la que comenzará a ejecutarse su predicción.

    Si está programando por hora (para predicciones diarias o semanales), también podrá especificar una hora de inicio y finalización entre las cuales se ejecutarán las predicciones.

  • Fecha de inicio: establezca la fecha en la que la programación de predicción entrará en vigor.

  • Fecha de finalización: establezca la fecha en la que las predicciones dejarán de ejecutarse según lo programado. De forma predeterminada, la programación se configurará para continuar ejecutándose indefinidamente, pero puede especificar una fecha de finalización para la programación.

  • Ejecutar solo si ha cambiado el conjunto de datos de aplicación: si no ha habido cambios en su conjunto de datos de aplicación desde que se ejecutó la última predicción, no se ejecutará una predicción programada. Puede desactivar esta configuración si desea ejecutar siempre la predicción programada independientemente de los cambios en los datos.

Eliminar las configuraciones de predicción

Puede eliminar las configuraciones de predicción existentes desde el panel Predicciones del conjunto de datos.

  1. En el panel Predicciones del conjunto de datos, haga clic en ... en la configuración de predicción que desea eliminar.

  2. Seleccione Eliminar configuración de la predicción en el menú Acciones.

  3. Haga clic en Eliminar para confirmar.

Administrar las tareas de predicción

Los administradores de un espacio empresarial inquilino pueden detener o cancelar los trabajos de predicción desde el centro de actividades Administración. Para más información, vea Administrar Qlik AutoML.

Configurar notificaciones

Puede recibir notificaciones cuando se crean predicciones a partir de una implementación de ML. Para más información, vea Configurar notificaciones para Qlik AutoML.

Visualizar los detalles de los eventos de predicción y deriva de datos

Después de ejecutar una predicción, cambie al panel de control Deriva de datos para ver detalles sobre los siguientes aspectos:

  • El nivel de deriva o desviación de los datos para cada característica en el conjunto de datos aplicado. La comparación se realiza entre su conjunto de datos de aplicación y el conjunto de datos de entrenamiento.

  • Detalles sobre el evento de predicción, como si tuvo éxito o fracasó y cuántas predicciones generó.

Para más información, vea Supervisión del rendimiento y el uso de los modelos implementados.

Más información

¿Esta página le ha sido útil?

No dude en indicarnos en qué podemos mejorar si encuentra algún problema en esta página o su contenido, como, por ejemplo, errores tipográficos, pasos que falta o errores técnicos.