Crear datos de predicciones
Una vez que haya Implementado y aprobado su modelo, podrá crear predicciones sobre nuevos datos.
Hasta ahora, hemos utilizado datos de clientes actuales para crear un modelo de aprendizaje automático. El objetivo de este proceso ha sido reconocer patrones a través del aprendizaje automático, con el objetivo de aplicarlos a nuevos datos.
También hay un caso de uso para analizar solo los valores de SHAP en los datos de entrenamiento. Esta información también es muy valiosa por derecho propio.
Para obtener más información sobre cómo trabajar con predicciones en Qlik AutoML, consulte Crear predicciones sobre conjuntos de datos.
El primer paso del proceso es elegir un conjunto de datos al que aplicará su modelo para generar predicciones. Después de esto, configuraremos las propiedades deseadas para el resultado de salida y generaremos los archivos.
Haga lo siguiente:
En el catálogo, abra su nueva implementación de ML.
-
En la esquina inferior derecha de la interfaz de la implementación de ML, haga clic en Crear predicción.
-
Haga clic en para abrir el panel Configuración de la predicción, si es que no está abierto ya.
-
A continuación, debe seleccionar su conjunto de datos de aplicación. En Aplicar datos, haga clic en Seleccionar el conjunto de datos de aplicación.
-
Seleccione el archivo del conjunto de datos de aplicación. Será uno de los siguientes, dependiendo de si trabaja con CSV o QVD:
-
AutoML Tutorial - Churn data - apply.csv
-
AutoML Tutorial - Churn data - apply.qvd
-
-
Compare los esquemas del entrenamiento y los conjuntos de datos de aplicación. Como descartó características durante el entrenamiento, su conjunto de datos de aplicación tendrá más campos que el conjunto de datos de entrenamiento. Esto no es motivo de preocupación. Al generar predicciones, AutoML simplemente ignora los campos del conjunto de datos de aplicación que no existen en el conjunto de datos de entrenamiento.
-
En el panel Configuración de la predicción, haga clic en Nombre del conjunto de datos de predicción. Escriba un nombre para el conjunto de datos (o deje el nombre predeterminado) y seleccione un formato. El formato predeterminado es Parquet, pero en este tutorial usaremos CSV.
-
Seleccione un espacio y haga clic en Confirmar.
-
En Opciones de predicción, configure los conjuntos de datos que desea generar con esta predicción. En este caso, confirme que SHAP de coordenadas es la única opción seleccionada. Permita que AccountID se utilice como columna de índice.
Haga clic en Guardar y predecir ahora. El proceso se puede supervisar en Predicciones del conjunto de datos.
Puede revisar el resultado en el catálogo, haciendo clic en Abrir en la ventana emergente que aparece.
Una vez que la predicción haya terminado de ejecutarse, puede comenzar a crear una aplicación utilizando los nuevos conjuntos de datos. Pase al siguiente tema.