Saltar al contenido principal Saltar al contenido complementario

Administrar perfiles de datos y metadatos a nivel de campo

Los metadatos a nivel de campo permiten a los usuarios aplicar alias, descripciones y clasificaciones a los campos; estas características ayudan a identificar datos específicos y campos con información confidencial.

Los administradores de datos acceden a información técnica sofisticada sobre sus conjuntos de datos desde la creación de perfiles. Los desarrolladores de apps utilizan las estadísticas de los perfiles y el muestreo de datos para obtener ideas y orientación en la creación de apps y para planificar las visualizaciones. La creación de perfiles de campo puede ayudar a los analistas de datos y usuarios de negocio a obtener conocimientos más rápidamente. Pueden visualizar valiosas métricas de perfiles de campo de un vistazo, sin necesidad de crear primero una app.

Nota informativaQlik Cloud solo perfila hasta 12 millones de filas en un conjunto de datos. Si un conjunto de datos supera los 12 millones de filas, solo se perfilan los primeros 12 millones de filas. Aún se agregan metadatos para todos los campos, independientemente del número de filas perfiladas.

Permisos

Se requieren permisos para perfilar y extraer muestras de datos. Debe tener un rol en el espacio del conjunto de datos que le permita perfilar las fuentes de datos. Para más información, vea Administrar permisos en espacios compartidos o Gestionar permisos en espacios administrados.

Administrar metadatos a nivel de campo

Puede acceder y editar los metadatos de cada campo de su conjunto de datos desde la pestaña Perfil. Seleccione cualquier panel de la vista de Vista de mosaico mosaico, cualquier fila de la vista de Vista de lista Lista o cualquier columna de la vista de Vista de datos Datos para abrir el panel de Detalles de ese campo a la derecha de la cuadrícula. Los campos de metadatos a nivel de campo (Aliasde campo, Descripción, Etiquetas y Clasificación) son opcionales y se pueden definir y editar desde este panel.

Campos de metadatos de campo
Detalle Descripción
Alias de campo Escriba un nombre alternativo opcional para que los nombres de los campos sean más representativos en el análisis del perfil. Los nombres de los campos de alias solo se muestran en el análisis del perfil y no afectan los nombres de las columnas técnicas.
Descripción

Indique cualquier información que pueda ser útil para los usuarios que visualizan metadatos de campo y perfiles para el campo.

Etiquetas Inserte fragmentos de texto para definir y categorizar este campo y sus datos.
Clasificación Seleccione la casilla de verificación de Información personal o Información confidencial.
Nota informativaLas clasificaciones de nivel de campo seleccionadas, la información personal y la Información confidencial aparecen en la pestaña Vista general del conjunto de datos enumerados por campo debajo de los metadatos del conjunto de datos técnicos.
Nota informativaClasificaciones aplicadas a campos en archivos de Excel con múltiples hojas se mostrarán listadas con el nombre de la hoja y el nombre del campo (ejemplo: Información personal: Hoja1/IDEmp).

Metadatos a nivel de campo para un archivo XLSX con varias hojas

Seleccione un panel de campo en la vista de mosaico para abrir el panel de Detalles

No todos los tipos de datos se perfilan de manera predeterminada. Los siguientes muestran en su lugar un perfil limitado hasta que usted los perfile:

  • QVD

  • Parquet

Para más información sobre el perfil limitado, consulte Vista limitada del perfil

Obtener perfiles de datos

Las estadísticas de perfil proporcionan análisis de columnas que miden la incidencia, los rangos y los valores que se dan dentro de los conjuntos de datos. Estas métricas describen relaciones entre valores de campo como:

  • Recuento de valores distintos (cardinalidad)
  • Valores de muestra, valores más comunes y frecuencia de valores
  • Redundancias útiles para identificar valores predeterminados o posibles duplicados
  • Recuentos de valores nulos, de cadena y numéricos
  • Información sobre rangos de valores que incluyen mínimo, máximo, promedio, suma y desviación estándar

Catalog proporciona tres vistas diferentes de los datos de perfiles de campos:

  • La vista de Mosaico es una representación visual, basada en paneles, de los campos dispuestos en forma de cuadrícula.

  • La vista de Lista es un resumen tabular de las estadísticas configurables del perfil.

  • La vista de Tabla muestra los nombres de las columnas de campo y hasta los veinte primeros registros del conjunto de datos.

Seleccione el icono TileVista de mosaico, ListVista de lista o Datos Vista de datos para cambiar entre las vistas del perfil.

Vista de Mosaico

La vista Mosaico de perfiles es un perfil de campo visual diseñado para mostrar el contenido más informativo para ese tipo de campo. El tipo de panel de vista predeterminado que se muestra viene determinado por si el número de valores numéricos o de texto es mayor para ese campo. Por ejemplo, para campos que contengan valores de texto y también valores numéricos, el tipo de panel Valores más comunes se muestra de forma predeterminada si hay más valores de texto y el tipo de panel de distribución numérica Frecuencia agrupada se muestra si hay más valores numéricos en el campo. Se proporciona un conmutador desplegable para que pueda cambiar al tipo de panel Valores más comunes para cualquier campo que tenga valores no únicos cuando esté seleccionado icono Valores más comunes; o puede volver al panel de distribución numérica si está seleccionado el panel Frecuencia agrupada icono Frecuencia agrupada. Tenga en cuenta que todos los tipos de paneles incluyen el número de valores nulos, si el campo tiene valores nulos.

Vista de mosaico: los campos son perfilados por métricas que son significativas para el tipo de datos contenidos en ese campo (por ejemplo: texto versus valores numéricos).

Vista de mosaico de perfil del conjunto de datos

El panel Valores de muestra

El panel Valores de muestra se muestra cuando todos los valores son únicos y solo de texto. Mostrará hasta un máximo de los tres primeros valores y el número total de valores únicos adicionales.

El panel en vista de mosaico: Valores de muestra
Mosaico de valores de muestra.

Criterios de perfilado según los Valores de muestra: los valores de los campos se perfilan con este panel cuando la cardinalidad es alta (todos los valores distintos). Si se diera el caso de que todos los valores fueran de texto y únicos, algunos valores de muestra proporcionan la mejor vista inicial de este tipo de datos de campo.

Cada panel de perfilado de los Valores de muestra proporciona:

  • Nombre del campo
  • Cardinalidad (valores distintos)
  • Hasta tres valores de muestra (los campos pueden tener menos de tres valores)

El panel Frecuencia de valores más comunes

El panel Frecuencia de valores más comunes muestra los cinco valores más comunes y su frecuencia. Si hay más de cinco valores distintos, estos se combinan y se muestran como Otros. Si faltan valores en algún campo, el total se muestra como Nulo. Este panel de perfiles se puede aplicar a valores de datos de texto, numéricos o mixtos.

El panel en vista de mosaico: Frecuencia de valores más comunes
El panel Frecuencia de valores más comunes

Criterios de Frecuencia de valores más comunes: campos que tienen pocos valores o una distribución sesgada de valores se perfilan con el panel de frecuencia de valores más comunes. Este perfilado solo se aplica cuando hay varias instancias de los mismos valores. Los usuarios pueden obtener una visión rápida de la distribución de los valores de campo. Si los datos del campo incluyen tanto valores de texto como numéricos y hay más texto que valores numéricos, se muestra el panel de frecuencia Valores más comunes. La opción de Frecuencia agrupada se proporciona cuando hay más de tres valores numéricos en el campo.

Cada panel de perfilado de Frecuencia de valores más comunes proporciona:

  • Nombre del campo
  • Cardinalidad (valores distintos)
  • Valores más comunes y su frecuencia
  • Otros frecuencia combinada de valores restantes

El panel Frecuencia de agrupamiento

El panel Frecuencia de agrupamiento muestra información de distribución y perfiles que es relevante para campos numéricos; incluidos los valores de datos mínimo, promedio y máximo. Si los datos del campo incluyen tanto texto como valores numéricos y hay más valores numéricos que de texto, se muestra el panel de Frecuencia de agrupamiento. El tipo de panel Frecuencia de valores más comunes está disponible para todos los campos que tienen valores no únicos.

El panel en vista de mosaico: Frecuencia de agrupamiento distribución numérica

El panel Frecuencia de agrupamiento

Cada panel de perfilado de Frecuencia de agrupamiento proporciona:

  • Nombre del campo
  • Cardinalidad (valores distintos)
  • Histograma que muestra la distribución de datos numéricos
  • Valor mínimo
  • Valor promedio (la suma de los números dividida por el número total de valores en el conjunto de datos)
  • Valor máximo

Vista de lista

La vista de lista de perfiles proporciona una tabla con opciones de estadísticas de perfiles. Los usuarios comprueban las métricas de interés más significativas para el conjunto de datos en el selector de columnas icono de columnas, que puede encontrarse desplazándose hasta el extremo derecho de la tabla. Las nueve primeras estadísticas están predeterminadas.

Vista de lista: seleccione las estadísticas del perfil de interés desde el selector de columnas que se encuentra al desplazarse a la derecha en la tabla.

Vista de lista de perfiles del conjunto de datos

Vista de Datos

La vista de datos de perfil muestra su conjunto de datos como una tabla de datos simple con los nombres de columna de campo y (hasta) los primeros veinte valores.

Vista de datos: nombres de las columnas del conjunto de datos y visualización de los veinte primeros registros.

Vista de datos de perfil del conjunto de datos

Vista limitada del perfil

Algunos conjuntos de datos no se perfilan de manera predeterminada. En su lugar, Perfil muestra un perfil limitado de los datos. Puede perfilar los datos haciendo clic en Crear perfil del conjunto de datos.

Los siguientes tipos de datos muestran una vista de perfil limitada hasta que se perfilan:

  • QVD

  • Parquet

Un perfil limitado de un conjunto de datos QVD

Más información

¿Esta página le ha sido útil?

No dude en indicarnos en qué podemos mejorar si encuentra algún problema en esta página o su contenido, como, por ejemplo, errores tipográficos, pasos que falta o errores técnicos.