Saltar al contenido principal Saltar al contenido complementario

Configuración de la calidad de los datos

Una vez que haya calculado la calidad de los datos de su conjunto de datos por primera vez, tendrá la posibilidad de actualizar este cálculo y personalizarlo según sus necesidades.

Nota informativaNecesita una de las siguientes suscripciones:
  • Qlik Talend Cloud Enterprise
  • Qlik Talend Cloud Premium
  • Analítica Premium de Qlik Cloud
  • Qlik Cloud Analytics Enterprise
  • Qlik Sense Enterprise SaaS

Seleccionar el tamaño de la muestra y el modo de procesamiento

Para poder personalizar el tamaño de la muestra para el cálculo de la calidad, debe haber hecho clic previamente en Calcular una vez en su conjunto de datos.

  1. Desde Qlik Talend Data Integration > Catálogo, abra su conjunto de datos.

  2. Dependiendo de cómo quiera computar la calidad de los datos:

    • Haga clic en Actualizar para volver a calcular la calidad de los datos utilizando los parámetros aplicados anteriormente.

    • Pulse la flecha hacia abajo situada junto al botón Actualizar para ampliar el panel Calidad y perfilado y personalizar el recálculo.

  3. En Tamaño de la muestra, introduzca el tamaño de la muestra sobre la que desea calcular la calidad de los datos:

    • Número de filas: indique el número de filas sobre las que desea calcular la calidad de los datos. El valor máximo es 10.0000 filas en modo extracción (pullup), no hay valor máximo en modo inserción (pushdown).

    • Porcentaje del conjunto de datos: alternativamente, indique el porcentaje del cojunto de datos sobre el que desea calcular la calidad de los datos. No se permiten valores decimales. Para conjuntos de datos grandes, si el 1% del conjunto de datos equivale a más del número máximo de filas permitido (100.000 filas), esta opción no se muestra.

  4. En Modo de procesamiento, seleccione el modo de procesamiento que se utilizará para calcular la calidad de los datos:

    • Pushdown: actualmente solo disponible para los conjuntos de datos de Snowflake y Databricks. Activa el cómputo de la calidad en el lado de la base de datos, lo que cuesta créditos de Snowflake o unidades de Databricks (DBU).

    • Extracción (Pullup): disponible para todos los conjuntos de datos. Activa el cálculo de la calidad en Qlik Cloud.

  5. Haga clic en Actualizar para volver a calcular la calidad de los datos según su configuración.

Los indicadores de calidad de los datos, así como el tamaño de la muestra, se muestran en la Vista general. El tiempo de procesamiento varía en función del tamaño de la muestra.

Nota informativaLa calidad de los datos no puede calcularse para conjuntos de datos que tengan más de 500 columnas.

El cálculo de la calidad de los datos también puede activarse y personalizarse a través de la correspondiente API pública de Qlik.

Para programar la calidad de los datos, puede utilizarse la plantilla de Qlik Automate Programar cálculos de calidad de datos. Vea All templates si desea más información.

Filtrar la vista previa del conjunto de datos por estado de calidad

Al ver su conjunto de datos en la pestaña Vista previa de datos, los resultados de calidad se representan visualmente mediante una barra de color en los encabezados de columna, así como en el panel derecho para los tipos de datos y las reglas de validación.

Cada segmento de la barra de calidad corresponde a una de las categorías de resultados. Desde el encabezado de la columna, puede ver los siguientes indicadores:

  • No válidos (rojo): muestra el porcentaje de valores de la muestra que se consideran no válidos.

  • Vacíos o nulos (negro): indica el porcentaje de valores de la muestra que están vacíos o son nulos.

  • Válidos (verde): muestra el porcentaje de valores válidos de la muestra. El porcentaje no tiene en cuenta los valores vacíos.

Al hacer clic en el encabezado de una columna, se abre el panel derecho, donde puede ver los mismos indicadores para los tipos de datos.

Además, la barra de calidad para las reglas de validación del panel derecho muestra:

  • No ejecutable (rojo claro): la regla no puede ejecutarse con esos valores.
  • No válido (rojo). Y o bien:
    • Cumplen la condición (if) pero no la expresión de validación (then), y no se ha definido ninguna expresión de validación alternativa (else).
    • No cumplen ni la condición (if) ni la expresión de validación alternativa (else).
  • No aplicable (verde claro): los valores no cumplen la condición (if) y no se ha definido ninguna expresión de validación alternativa (else).
  • Válido (verde): los valores cumplen todas las declaraciones de reglas.

Para más información sobre las reglas de validación, consulte Trabajar con las reglas de validación.

Puede filtrar la vista previa del conjunto de datos haciendo clic en cualquier segmento de la barra de calidad, ya sea en el encabezado de la columna o en las secciones de reglas y tipos de datos del panel derecho. Cuando hace clic en un segmento de color:

  • Se aplica un filtro a la vista previa actual para mostrar solo las filas correspondientes a ese resultado de calidad de datos (para la columna o grupo de columnas seleccionados) y para aislar los problemas de calidad.
  • El filtro se puede eliminar para volver a la vista previa completa de la muestra. Para eliminar los filtros, haga clic en Borrar todos los filtros.

Este filtrado le ayuda a inspeccionar rápidamente solo los valores de interés en su conjunto de datos, lo que simplifica la revisión e investigación de los registros según su estado de calidad de datos.

¿Esta página le ha sido útil?

Si encuentra algún problema con esta página o su contenido (errores tipográficos, pasos que faltan o errores técnicos), no dude en ponerse en contacto con nosotros.