Saltar al contenido principal Saltar al contenido complementario

Gestión de perfiles de datos y metadatos a nivel de campo

Los administradores de datos acceden a información técnica sofisticada sobre sus conjuntos de datos desde la elaboración de perfiles. Los desarrolladores de apps utilizan estadísticas de perfiles y muestreo de datos para obtener ideas y orientación para crear apps y planificar visualizaciones. La creación de perfiles de campo puede ayudar a los analistas de datos y a los usuarios de negocio a obtener conocimientos más rápidamente. Pueden visualizar valiosas métricas de perfiles de campo de un vistazo, sin necesidad de crear una app primero. Los metadatos a nivel de campo permiten a los usuarios aplicar alias, descripciones y clasificaciones a los campos; estas funciones ayudan a identificar datos específicos y campos confidenciales.

Nota informativaQlik Cloud solo perfila hasta 12 millones de filas en un conjunto de datos. Si un conjunto de datos supera los 12 millones de filas, solo se perfilan los primeros 12 millones de filas. Aún se agregan metadatos para todos los campos, independientemente del número de filas perfiladas.

Gestión de metadatos a nivel de campo

Puede acceder y editar los metadatos de cada campo de su conjunto de datos desde la pestaña Campos. Seleccione cualquier panel de la vista Seleccione el icono de mosaico para ver la vista de mosaico Tile, cualquier fila de la vista Seleccione el icono de lista para ver la lista List o cualquier columna de la vista Datos para abrir el panel de Detalles de ese campo a la derecha de la cuadrícula. Los campos de metadatos a nivel de campo (Aliasde campo, Descripción, Etiquetas y Clasificación) son opcionales y se pueden definir y editar desde este panel.

Campos de metadatos de campo
Detalle Descripción
Alias de campo Escriba un nombre alternativo opcional para que los nombres de los campos sean más representativos en el análisis del perfil. Los nombres de los campos de alias solo se muestran en el análisis del perfil y no afectan los nombres de las columnas técnicas.
Descripción

Indique cualquier información que pueda ser útil para los usuarios que visualizan metadatos de campo y perfiles para el campo.

Etiquetas Inserte fragmentos de texto para definir y categorizar este campo y sus datos.
Clasificación Seleccione la casilla de verificación de Información personal o Información confidencial.
Nota informativaLas clasificaciones de nivel de campo seleccionadas, la información personal y la Información confidencial aparecen en la pestaña Vista general del conjunto de datos enumerados por campo debajo de los metadatos del conjunto de datos técnicos.
Nota informativaLas clasificaciones aplicadas a campos en archivos de Excel con varias hojas se enumerarán con el nombre de la hoja y el nombre del campo (ejemplo: Información personal: Hoja1/EmpID).

Metadatos a nivel de campo para un archivo XLSX con varias hojas

Seleccione un panel de campo en la vista de mosaico para abrir el panel de Detalles

Obtener perfiles de datos

Las estadísticas de perfil proporcionan análisis de columnas que miden la incidencia, los rangos y los valores que se dan dentro de los conjuntos de datos. Estas métricas describen relaciones entre valores de campo como:

  • Recuento de valores distintos (cardinalidad)
  • Valores de muestra, valores más comunes y frecuencia de valores
  • Redundancias útiles para identificar valores predeterminados o posibles duplicados
  • Recuentos de valores nulos, de cadena y numéricos
  • Información sobre rangos de valores que incluyen mínimo, máximo, promedio, suma y desviación estándar

Catalog proporciona tres vistas diferentes de los datos de perfiles de campos: Tile view, List view y Data view.

Tile view es una representación visual basada en tarjetas de campos dispuestos como una cuadrícula.

List view es un resumen con forma de tabla de estadísticas de perfil configurables.

Table view muestra los nombres de las columnas de los campos y hasta los veinte primeros registros del conjunto de datos.

Seleccione el icono TileSeleccione el icono de mosaico para ver la vista de mosaico, ListSeleccione el icono de lista para ver la lista o Datos para cambiar entre las vistas de perfil.

La vista Mosaico de perfiles

La vista Mosaico de perfiles es un perfil de campo visual diseñado para mostrar el contenido más informativo para ese tipo de campo. El tipo de panel de vista predeterminado que se muestra viene determinado por si el número de valores numéricos o de texto es mayor para ese campo. Por ejemplo, para campos que contengan valores de texto y también valores numéricos, el tipo de panel Valores más comunes se muestra de forma predeterminada si hay más valores de texto y el tipo de panel de distribución numérica Frecuencia agrupada se muestra si hay más valores numéricos en el campo. Se proporciona un conmutador desplegable para que pueda cambiar al tipo de panel Valores más comunes para cualquier campo que tenga valores no únicos cuando esté seleccionado icono Valores más comunes; o puede volver al panel de distribución numérica si está seleccionado el panel Frecuencia agrupada icono Frecuencia agrupada. Tenga en cuenta que todos los tipos de paneles incluyen el número de valores nulos, si el campo tiene valores nulos.

Vista de mosaico: Los campos se perfilan mediante métricas que son significativas para el tipo de datos contenidos en ese campo (por ejemplo: valores de texto versus valores numéricos)

Vista de mosaico de perfil del conjunto de datos

El panel Valores de muestra

El panel Valores de muestra se muestra cuando todos los valores son únicos y solo de texto. Mostrará hasta un máximo de los tres primeros valores y el número total de valores únicos adicionales.

Panel de vista de mosaico: Valores de muestra
Mosaico de valores de muestra.

Criterios de perfilado de los Valores de muestra: Los valores de campo se perfilan con este panel cuando la cardinalidad es alta (todos los valores son distintos). Si se diera el caso de que todos los valores fueran de texto y únicos, algunos valores de muestra proporcionan la mejor vista inicial de este tipo de datos de campo.

Cada panel de Valores de muestra proporciona: 

  • Nombre de campo
  • Cardinalidad (valores distintos)
  • Hasta tres valores de muestra (los campos pueden tener menos de tres valores)

El panel Frecuencia de valores más comunes

El panel Frecuencia de valores más comunes muestra los cinco valores más comunes y su frecuencia. Si hay más de cinco valores distintos, estos se combinan y se muestran como Otros. Si faltan valores en algún campo, el total se muestra como Nulo. Este panel de perfiles se puede aplicar a valores de datos de texto, numéricos o mixtos.

Panel de vista de mosaico: Frecuencia de valores más comunes
El panel Frecuencia de valores más comunes

Criterios de Frecuencia de valores más comunes: Los campos que tienen pocos valores o una distribución sesgada de valores se perfilan con el panel de frecuencia de valores más comunes. Este perfilado solo se aplica cuando hay varias instancias de los mismos valores. Los usuarios pueden obtener una visión rápida de la distribución de los valores de campo. Si los datos del campo incluyen tanto valores de texto como numéricos y hay más texto que valores numéricos, se muestra el panel de frecuencia Valores más comunes. El conmutador de Frecuencia agrupada se proporciona cuando hay más de tres valores numéricos en el campo.

Cada panel de perfiles Frecuencia de valores más comunes proporciona: 

  • Nombre de campo
  • Cardinalidad (valores distintos)
  • Valores más comunes y su frecuencia
  • Otros frecuencia combinada de valores restantes

El panel Frecuencia agrupada

El panel Frecuencia agrupada muestra información de distribución y perfiles que es relevante para campos numéricos; incluidos los valores de datos mínimo, promedio y máximo. Si los datos del campo incluyen tanto texto como valores numéricos, y hay más valores numéricos que de texto, se muestra el panel de Frecuencia agrupada. El tipo de panel Frecuencia de valores más comunes está disponible para todos los campos que tienen valores no únicos.

Panel de vista de mosaico:Distribución numérica de Frecuencia agrupada

El panel Frecuencia agrupada

Cada panel de Frecuencia agrupada proporciona: 

  • Nombre de campo
  • Cardinalidad (valores distintos)
  • Histograma que muestra la distribución de datos numéricos
  • Valor mínimo
  • Valor promedio (la suma de los números dividida por el número total de valores en el conjunto de datos)
  • Valor máximo

Vista de la lista de perfiles

La vista de lista de perfiles proporciona una tabla con opciones de estadísticas de perfiles. Los usuarios verifican las métricas de interés que son más significativas para el conjunto de datos en el selector ColumnPicker icono columnas, que se puede encontrar desplazándose hasta el extremo derecho de la tabla. Las primeras nueve estadísticas están preseleccionadas de forma predeterminada.

Vista de lista:Seleccione las estadísticas de perfil de interés del menú desplegable ColumnPicker que se encuentra desplazándose hacia la derecha en la tabla

Vista de lista de perfiles del conjunto de datos

La vista Datos de perfil

La vista de datos de perfil muestra su conjunto de datos como una tabla de datos simple con los nombres de columna de campo y (hasta) los primeros veinte valores.

Vista de datos:Se muestran los nombres de las columnas del conjunto de datos y los primeros veinte registros

Vista de datos de perfil del conjunto de datos

Permisos

Se requieren permisos para perfilar y extraer muestras de datos. Debe tener un rol en el espacio del conjunto de datos que le permita perfilar las fuentes de datos. Para más información, vea Administrar permisos en espacios compartidos o Gestionar permisos en espacios administrados.

Más información

¿Esta página le ha sido útil?

No dude en indicarnos en qué podemos mejorar si encuentra algún problema en esta página o su contenido, como, por ejemplo, errores tipográficos, pasos que falta o errores técnicos.