Configurar el cálculo de la calidad de los datos
Una vez que haya calculado la calidad de los datos de su conjunto de datos por primera vez, tendrá la posibilidad de actualizar este cálculo y personalizarlo según sus necesidades.
Seleccionar el tamaño de la muestra y el modo de procesamiento
Para poder personalizar el tamaño de la muestra para el cálculo de la calidad, debe haber hecho clic previamente en Calcular una vez en su conjunto de datos.
-
Desde Qlik Talend Data Integration > Catálogo, abra su conjunto de datos.
-
Dependiendo de cómo quiera computar la calidad de los datos:
-
Haga clic en Actualizar para volver a calcular la calidad de los datos utilizando los parámetros aplicados anteriormente.
-
Pulse la flecha hacia abajo situada junto al botón Actualizar para ampliar el panel Calidad y perfilado y personalizar el recálculo.
-
-
En Tamaño de la muestra, introduzca el tamaño de la muestra sobre la que desea calcular la calidad de los datos:
-
Número de filas: indique el número de filas sobre las que desea calcular la calidad de los datos. El valor máximo es 10.0000 filas en modo extracción (pullup), no hay valor máximo en modo inserción (pushdown).
-
Porcentaje del conjunto de datos: alternativamente, indique el porcentaje del cojunto de datos sobre el que desea calcular la calidad de los datos. No se permiten valores decimales. Para conjuntos de datos grandes, si el 1% del conjunto de datos equivale a más del número máximo de filas permitido (100.000 filas), esta opción no se muestra.
-
-
En Modo de procesamiento, seleccione el modo de procesamiento que se utilizará para calcular la calidad de los datos:
-
Pushdown: actualmente solo disponible para los conjuntos de datos de Snowflake y Databricks. Activa el cómputo de la calidad en el lado de la base de datos, lo que cuesta créditos de Snowflake o unidades de Databricks (DBU).
-
Extracción (Pullup): disponible para todos los conjuntos de datos. Activa el cálculo de la calidad en Qlik Cloud.
-
-
Haga clic en Actualizar para volver a calcular la calidad de los datos según su configuración.
Los indicadores de calidad de los datos, así como el tamaño de la muestra, se muestran en la Vista general. El tiempo de procesamiento varía en función del tamaño de la muestra. Tenga en cuenta que la vista previa de datos muestra siempre únicamente 100 registros.
El cálculo de la calidad de los datos también puede activarse y personalizarse a través de la correspondiente API pública de Qlik.
Para programar la calidad de los datos, puede utilizarse la plantilla de Qlik Automate Programar cálculos de calidad de datos. Vea All templates si desea más información.