Saltar al contenido principal Saltar al contenido complementario

Calidad de datos de los conjuntos de datos basados en archivos

Para beneficiarse del descubrimiento de tipos semánticos y de las lecturas de calidad de los datos en sus conjuntos de datos basados en archivos, debe cargar los archivos en su catálogo.

A partir de ahora, los tipos de archivo admitidos para el cálculo de la calidad son CSV, TXT, QVD, XLS y XLSX. Si su archivo de Excel contiene varias hojas, el cálculo de la calidad se realizará únicamente en la primera hoja.

Nota informativaNecesita una suscripción a Qlik Talend Cloud Enterprise.

Crear conjuntos de datos basados en archivos

Para que pueda crear conjuntos de datos a partir de un archivo, y posteriormente tener acceso a su esquema y calidad en la vista general del conjunto de datos y la vista general de productos de datos, deberá cargarlos en Qlik Talend Data Integration.

  1. En Qlik Talend Data Integration > Catálogo, haga clic en Crear y, a continuación, en Conjunto de datos.

  2. Haga clic en Cargar archivo de datos.

  3. Busque el archivo que desea cargar, seleccione el espacio en el que desea cargarlo y haga clic en Cargar.

    Si hace clic en Cargar y analizar, se crearán tanto un conjunto de datos como una app de análisis a partir de dicho archivo.

El nuevo conjunto de datos se añade al Catálogo y podrá acceder a los indicadores de calidad y a más detalles sobre su contenido. Esta configuración también permite utilizar el conjunto de datos basado en archivos como fuente para las apps de análisis.

Dado que se puede acceder al Catálogo tanto desde el centro de control de Qlik Talend Data Integration, como desde los Servicios de analítica de Qlik, puede abrir sus conjuntos de datos en la ubicación que prefiera y se utilizará la conexión adecuada dependiendo del contexto.

Calcular la calidad

Al utilizar el botón Calcular o Actualizar en la Vista general de su conjunto de datos, se desencadena un cálculo de calidad en una muestra de 1000 filas de la base de datos. Esta operación se realiza en modo de extracción (pullup) para los conjuntos de datos basados en archivos.

Se recupera una muestra de 100 filas y se visualiza como una vista previa con los tipos semánticos actualizados, las estadísticas de validez y exhaustividad. Después, esta muestra se almacena en MongoDB.

¿Esta página le ha sido útil?

Si encuentra algún problema con esta página o su contenido (errores tipográficos, pasos que faltan o errores técnicos), no dude en ponerse en contacto con nosotros.