Saltar al contenido principal

Analizar el linaje de datos con un análisis de impacto

Vea el linaje de las fuentes de datos y apps con un análisis de impacto. El análisis de impacto ofrece una vista gráfica del linaje de un conjunto de datos o app, y muestra las entradas y los resultados de datos.

El gráfico de linaje muestra el flujo de datos de las apps y los datos en su organización. Abra el gráfico de linaje haciendo clic en en una app o en un conjunto de datos y seleccionando a continuación Análisis de impacto. También puede acceder al gráfico de linaje desde la sección Detalles de un conjunto de datos.

El gráfico de linaje

A lineage graph showing the dataflow through different nodes

El gráfico de linaje muestra cómo se utilizan los datos en las aplicaciones y los conjuntos de datos. Visualiza las apps y los conjuntos de datos como nodos. Cada nodo está conectado por flechas que muestran el flujo de datos. Por ejemplo, puede ver qué nodos de conjuntos de datos utilizan los nodos de la app, y qué nodos de la app generan conjuntos de datos que son utilizados por otras apps. Puede ver claramente el uso y las dependencias entre las apps y los conjuntos de datos.

Permisos

Debe tener permisos para ver una app o un conjunto de datos para poder ver el análisis de impacto del elemento en cuestión desde el centro de control. En el gráfico de linaje, puede ver nodos pertenecientes a apps y conjuntos de datos a los que no tiene acceso, pero que están en el linaje del elemento seleccionado para el análisis. Para estos nodos, puede ver el nombre, pero no puede abrirlos ni ver los detalles. Puede elegir ver el análisis de impacto de estos nodos para ver su linaje.

El análisis de impacto no está disponible de forma predeterminada en un espacio empresarial inquilino; un administrador del espacio empresarial inquilino debe hacer que esté disponible. Vea Administrar el análisis de impacto.

Roles

Los gráficos de linaje respaldan diferentes roles en su organización.

Administradores de datos

El gráfico de linaje ayuda a los administradores de datos a comprender el linaje de los mismos, lo que facilita la incorporación de metadatos y la resolución de problemas de calidad. El gráfico puede mejorar la eficiencia operativa, ayudando a identificar fácilmente los procesos de los conjuntos de datos, el uso y las posibles duplicaciones.

Desarrolladores de aplicaciones y modeladores de datos

El gráfico de linaje mejora la confianza y la comprensión de las fuentes de datos. Vea el historial completo de un conjunto de datos, qué apps lo utilizan e identifique nueva información derivada de un conjunto de datos. Confíe en que los datos son los adecuados para su app o modelo de datos.

El gráfico de linaje

El gráfico de linaje muestra nodos en el linaje de una fuente de datos. Cada nodo representa un paso en el linaje de la app o el conjunto de datos que seleccione. Esta información de linaje se compila cada vez que una app carga o vuelve a cargar datos. Si su app no se ha recargado recientemente, el linaje puede estar incompleto o ser inexacto.

Los siguientes tipos de nodos se muestran en el gráfico de linaje:

  • Conjunto de datos: Los conjuntos de datos son fuentes de datos, como conectores o archivos de datos. Los conjuntos de datos suelen ser las fuentes de datos que se agregan a un espacio o se generan a partir de una app como un archivo qvd. Los nodos de conjunto de datos muestran la ubicación del conjunto de datos y si se trata de un espacio compartido o administrado.

  • App: Los nodos de app representan apps analíticas de Qlik Sense que utilizan las fuentes de datos en el linaje. Los nodos de app muestra el nombre de la app y su ubicación como QCS (Qlik Cloud).

Los nodos disponibles en un gráfico de linaje son las entradas para la app o el conjunto de datos que haya seleccionado, o las salidas o resultados de su app o conjunto de datos.

Seleccione un conjunto de datos o una app para designarlos como nodo raíz para el análisis de impacto. En el gráfico de linaje, se marca con un borde de color gris oscuro.

Un nodo raíz

The root node of a lineage graph, with a dark grey border.

El gráfico de linaje muestra un recuento de los nodos de entrada y salida del nodo raíz. Los nodos de entrada son nodos que se encuentran más arriba del nodo raíz. Los nodos de entrada típicos incluyen fuentes de datos que son utilizadas por el nodo raíz, o apps que producen conjuntos de datos que son utilizados por el nodo raíz. Los nodos de salida son nodos que se encuentran por debajo del nodo raíz. Los nodos de salida típicos son las apps que utilizan el nodo raíz como fuente de datos o los conjuntos de datos emitidos por el nodo raíz.

Seleccione un nodo haciendo clic en el mismo. Cuando se selecciona un nodo, el linaje a ese nodo se resalta en verde y puede ver los detalles disponibles del nodo.

Linaje destacado de un nodo seleccionado con detalles

A node has been selected, showing its complete lineage through the other nodes highlighted in green.

Detalles de nodo

Los detalles están limitados por su acceso a la app o al conjunto de datos. Los detalles pueden proporcionar la siguiente información:

  • Nombre

  • Descripción

  • Etiquetas

  • Localización

  • Espacio

  • Propietario

  • Creador

  • Modificado por última vez

Si no tiene permiso para ver la app o el conjunto de datos, solo puede ver el nombre.

Navegar por el gráfico de linaje

Haga clic y arrastre para navegar por el gráfico de linaje. También puede utilizar los botones de navegación. Puede hacer clic en Home para centrar el gráfico de linaje en el nodo raíz. Utilice el botón de avance y retroceso para desplazarse por sus selecciones.

Navegación por el gráfico de linaje

Navigation buttons for the lineage graph.

Para cambiar el nodo raíz que se está analizando, seleccione un nodo y luego seleccione Análisis de impacto en el panel de detalles.

Filtre el gráfico de linaje para ver solo las entradas o salidas del nodo raíz. Busque nodos específicos utilizando el cuadro de búsqueda.

Cuadro de búsqueda y filtros de entrada y salida

The lineage graph search box and input and output filters.

Los grandes grupos de nodos que ocupan la misma posición en el linaje pueden contraerse en un grupo. Puede expandirlos para ver todos los nodos. También puede mostrar un nodo en un grupo contraído buscándolo.

Nodos con nodos contraídos por debajo

Nodes with collapsed nodes beneath. The collapsed nodes are hidden beneath a Show more option.

Limitaciones

El análisis de impacto y el gráfico de linaje tienen las siguientes limitaciones:

  • Las apps que no se hayan recargado tras la publicación del análisis de impacto en Qlik Sense SaaS puede que no tengan la información completa del linaje disponible para las mismas hasta después de su recarga. Los detalles de algunos nodos pueden estar limitados si no se han cargados después de activar el análisis de impacto para el espacio empresarial inquilino.

  • Los detalles de nodos de los conjuntos de datos fuera del espacio empresarial inquilino, como las conexiones de SQL Server o Google Drive, se limitan al tipo y nombre del conjunto de datos. Las conexiones REST solo muestran que se trata de datos REST.

Usar el gráfico de linaje

Rastrear el origen y el uso de los datos. Hacer un seguimiento del linaje de los datos le ayuda a comprender de dónde proceden los datos y cómo se mueven y son utilizados por su organización.

Los desarrolladores de aplicaciones pueden utilizar el gráfico de linaje para mejorar la confianza y la comprensión de las fuentes de datos. Responde a preguntas como:

  • ¿De dónde procede este conjunto de datos?

  • ¿Qué aplicaciones usan este conjunto de datos?

  • ¿Hay otros conjuntos de datos derivados de este conjunto de datos?

Los desarrolladores de aplicaciones pueden encontrar múltiples conjuntos de datos relacionados con un área temática. Al ver el linaje del conjunto de datos, puede ver su procedencia y qué otras apps usan los datos.

Para un administrador de datos, puede usar el gráfico de linaje para mejorar la eficacia operativa, la colaboración y la calidad de los datos. Responde a preguntas como:

  • ¿Qué conjuntos de datos no se usan en las apps?

  • ¿Qué conjuntos de datos son potenciales duplicados?

  • ¿Se pueden simplificar la canalización de datos y las transformaciones?

  • ¿Cuáles son las consecuencias posteriores de un cambio en un conjunto de datos en cualquier punto de la canalización de datos?

Ejemplo: Encontrar conjuntos de datos con el gráfico de linaje

Como desarrollador de aplicaciones, su administrador de datos puede proporcionarle conjuntos de datos a partir de los cuales desea desarrollar apps. En este ejemplo, el administrador de datos dijo que debían utilizarse archivos QVD desde la app QVD Output-2. Si se observa el espacio compartido en el que salen los archivos QVD, no queda claro de inmediato qué conjuntos de datos hay que utilizar.

Espacio de salida de QVD

The QVD Output space, showing all the QVD files sotre in it. Many are similarly named.

Haga clic en en uno de los conjuntos de datos, en este caso EmployeeData y después seleccione Análisis de impacto.

Un análisis de impacto de EmployeeData

Impact analysis of the QVD file EmployeeData.

Al ascender por el linaje, puede ver que este conjunto de datos es una salida de QVD Output-2. Seleccione QVD-Output 2 y luego vea el análisis de impacto.

Análisis de impacto de QVD-Output-2

The impact analyiss of the app QVD-Output2

Ahora puede ver todas las salidas de QVD-Output-2 y saber qué fuentes de datos debe usar en su app.

Ejemplo: Diagnosticar problemas de datos con el gráfico de linaje

Como desarrollador de aplicaciones, un cliente que utiliza una de mis aplicaciones App7, indicó que algunos datos parecen estar obsoletos en la app. Todo parece correcto cuando se ejecuta el script de carga, así que abro Análisis de impacto en la app y miro las entradas. Al mirar los detalles de cada uno de los archivos QVD de origen, verá que uno de ellos, Support, no se ha cargado desde hace siete días.

Detalles de Support

Details in lineage graph for the node Support.qvd. In the details, you can see that it was last modified 7 days ago.

Puede determinar el propietario de la app y ponerse en contacto con él para investigar más a fondo.

Ejemplo: Evaluar impactos descendentes

Como administrador de datos, está planeando realizar actualizaciones en el script de carga y en la salida de una de mis apps más antiguas que procesa datos de conectores. Un análisis de impacto de la app de procesamiento, QVD-Output-1, puede determinar el impacto descendente y ver qué salidas se siguen utilizando.

Análisis del impacto de QVD-Output-1

An impact analysis of the app QVD-Output-1.

Hay varias apps posteriores que utilizan la salida de QVD-Output-1. Seleccione las apps para ver los propietarios de las mismas.

Detalles de App1

The details for the app App1. This app uses a large number of qvds output from QVD-Output-1.

Antes de realizar mis cambios planificados, deberá hablar con los propietarios de la app para asegurarse de que la funcionalidad de la app no se vea afectada por ningún cambio planificado.

Ejemplo: Identificar redundancias en la canalización de datos

Como administrador de datos, decide revisar todo el proceso de datos para identificar oportunidades de simplificar y consolidar el proceso. Sabe que hay dos apps que procesan datos de uno de sus conectores. Seleccione una de las apps para el análisis de impacto y luego seleccione el conector de datos para ver su análisis de impacto.

Análisis de impacto del conector de datos

An impact anaylsis of the node of the data connection, showing the full scope of the downstream data lineage. There are two apps using this data source to output a large number of QVD files that are used by 4 apps.

Hay dos apps de procesador que generan QVD desde este conector. Existe cierta similitud entre las salidas de las dos apps. Es posible que haya redundancias que se puedan consolidarse en una aplicación de procesador único, con potencialmente menos salidas. Investigue estas apps y sus salidas con más atención para ver si se pueden simplificar.