Calidad de datos de los conjuntos de datos basados en archivos

Para beneficiarse del descubrimiento de tipos semánticos y de las lecturas de calidad de los datos en sus conjuntos de datos basados en archivos, debe cargar los archivos en su catálogo.

A partir de ahora, los tipos de archivo admitidos para el cálculo de la calidad son CSV, TXT, QVD, XLS y XLSX, dentro de estos límites:

CSV/TXT hasta 1 GB
QVD hasta 1 GB
XLS/XLSX hasta 100 MB

La calidad de los datos no es compatible para conjuntos de datos basados en archivos que superen estos límites. Si su archivo de Excel contiene varias hojas, el cálculo de la calidad se realizará únicamente en la primera hoja.

Necesita una de las siguientes suscripciones:

Qlik Talend Cloud Enterprise
Qlik Talend Cloud Premium
Analítica Premium de Qlik Cloud
Qlik Cloud Analytics Enterprise
Qlik Sense Enterprise SaaS

Crear conjuntos de datos basados en archivos

Para que pueda crear conjuntos de datos a partir de un archivo, y posteriormente tener acceso a su esquema y calidad en la vista general del conjunto de datos y la vista general de productos de datos, deberá cargarlos en Qlik Talend Data Integration.

En Qlik Talend Data Integration > Catálogo, haga clic en Crear nuevo y, a continuación, en Conjunto de datos.
Haga clic en Cargar archivo de datos.
Busque el archivo que desea cargar, seleccione el espacio en el que desea cargarlo y haga clic en Cargar.

Si hace clic en Cargar y analizar, se crearán tanto un conjunto de datos como una aplicación de análisis a partir de este archivo.

El nuevo conjunto de datos se añade al Catálogo y podrá acceder a los indicadores de calidad y a más detalles sobre su contenido. Esta configuración también permite utilizar el conjunto de datos basado en archivos como fuente para las aplicaciones de análisis.

Dado que se puede acceder al Catálogo tanto desde el centro de control de Qlik Talend Data Integration, como desde los Servicios de analítica de Qlik, puede abrir sus conjuntos de datos en la ubicación que prefiera y se utilizará la conexión adecuada dependiendo del contexto.

Calcular la calidad

Al utilizar el botón Calcular o Actualizar en la Vista general de su conjunto de datos, se desencadena un cálculo de calidad en una muestra de 1.000 filas de la base de datos. Esta operación se realiza en modo pullup para los conjuntos de datos basados en archivos.

Después de calcular la calidad de los datos, se recupera y se muestra una vista previa de hasta 1.000 filas (predeterminado) con tipos semánticos actualizados, validez y estadísticas de exhaustividad. Después, esta muestra se almacena en MongoDB. Para configurar el tamaño de la vista previa del conjunto de datos (100 o 1.000 filas), los administradores del espacio empresarial inquilino deben ir a la página de Configuración en el centro de actividades de Administración; para obtener más información, consulte Configurar el tamaño de la vista previa del conjunto de datos.

¿Esta página le ha sido útil?

Si encuentra algún problema con esta página o su contenido (errores tipográficos, pasos que faltan o errores técnicos), no dude en ponerse en contacto con nosotros.

Deje aquí sus comentarios