Gestión de perfiles de datos y metadatos a nivel de campo
Los administradores de datos acceden a información técnica sofisticada sobre sus conjuntos de datos desde la elaboración de perfiles. Los desarrolladores de apps utilizan estadísticas de perfiles y muestreo de datos para obtener ideas y orientación para crear apps y planificar visualizaciones. La creación de perfiles de campo puede ayudar a los analistas de datos y a los usuarios de negocio a obtener conocimientos más rápidamente. Pueden visualizar valiosas métricas de perfiles de campo de un vistazo, sin necesidad de crear una app primero. Los metadatos a nivel de campo permiten a los usuarios aplicar alias, descripciones y clasificaciones a los campos; estas funciones ayudan a identificar datos específicos y campos confidenciales.
Gestión de metadatos a nivel de campo
Puede acceder y editar los metadatos de cada campo de su conjunto de datos desde la pestaña Campos. Seleccione cualquier panel de la vista de mosaico, cualquier fila de la vista de Lista o cualquier columna de la vista de Datos para abrir el panel de Detalles de ese campo a la derecha de la cuadrícula. Los campos de metadatos a nivel de campo (Aliasde campo, Descripción, Etiquetas y Clasificación) son opcionales y se pueden definir y editar desde este panel.
Detalle | Descripción |
---|---|
Alias de campo | Escriba un nombre alternativo opcional para que los nombres de los campos sean más representativos en el análisis del perfil. Los nombres de los campos de alias solo se muestran en el análisis del perfil y no afectan los nombres de las columnas técnicas. |
Descripción | Indique cualquier información que pueda ser útil para los usuarios que visualizan metadatos de campo y perfiles para el campo. |
Etiquetas | Inserte fragmentos de texto para definir y categorizar este campo y sus datos. |
Clasificación | Seleccione la casilla de verificación de Información personal o Información confidencial. |
Obtener perfiles de datos
Las estadísticas de perfil proporcionan análisis de columnas que miden la incidencia, los rangos y los valores que se dan dentro de los conjuntos de datos. Estas métricas describen relaciones entre valores de campo como:
- Recuento de valores distintos (cardinalidad)
- Valores de muestra, valores más comunes y frecuencia de valores
- Redundancias útiles para identificar valores predeterminados o posibles duplicados
- Recuentos de valores nulos, de cadena y numéricos
- Información sobre rangos de valores que incluyen mínimo, máximo, promedio, suma y desviación estándar
Catalog proporciona tres vistas diferentes de los datos de perfiles de campos: Tile view, List view y Data view.
Tile view es una representación visual basada en tarjetas de campos dispuestos como una cuadrícula.
List view es un resumen con forma de tabla de estadísticas de perfil configurables.
Table view muestra los nombres de las columnas de los campos y hasta los veinte primeros registros del conjunto de datos.
Seleccione el icono Tile, List o Datos para cambiar entre las vistas de perfil.
La vista Mosaico de perfiles
La vista Mosaico de perfiles es un perfil de campo visual diseñado para mostrar el contenido más informativo para ese tipo de campo. El tipo de panel de vista predeterminado que se muestra viene determinado por si el número de valores numéricos o de texto es mayor para ese campo. Por ejemplo, para campos que contengan valores de texto y también valores numéricos, el tipo de panel Valores más comunes se muestra de forma predeterminada si hay más valores de texto y el tipo de panel de distribución numérica Frecuencia agrupada se muestra si hay más valores numéricos en el campo. Se proporciona un conmutador desplegable para que pueda cambiar al tipo de panel Valores más comunes para cualquier campo que tenga valores no únicos cuando esté seleccionado ; o puede volver al panel de distribución numérica si está seleccionado el panel Frecuencia agrupada . Tenga en cuenta que todos los tipos de paneles incluyen el número de valores nulos, si el campo tiene valores nulos.
El panel Valores de muestra
El panel Valores de muestra se muestra cuando todos los valores son únicos y solo de texto. Mostrará hasta un máximo de los tres primeros valores y el número total de valores únicos adicionales.
Criterios de perfilado según los Valores de muestra: los valores de los campos se perfilan con este panel cuando la cardinalidad es alta (todos los valores distintos). Si se diera el caso de que todos los valores fueran de texto y únicos, algunos valores de muestra proporcionan la mejor vista inicial de este tipo de datos de campo.
Cada panel de perfilado de los Valores de muestra proporciona:
- Nombre del campo
- Cardinalidad (valores distintos)
- Hasta tres valores de muestra (los campos pueden tener menos de tres valores)
El panel Frecuencia de valores más comunes
El panel Frecuencia de valores más comunes muestra los cinco valores más comunes y su frecuencia. Si hay más de cinco valores distintos, estos se combinan y se muestran como Otros. Si faltan valores en algún campo, el total se muestra como Nulo. Este panel de perfiles se puede aplicar a valores de datos de texto, numéricos o mixtos.
Criterios de Frecuencia de valores más comunes: campos que tienen pocos valores o una distribución sesgada de valores se perfilan con el panel de frecuencia de valores más comunes. Este perfilado solo se aplica cuando hay varias instancias de los mismos valores. Los usuarios pueden obtener una visión rápida de la distribución de los valores de campo. Si los datos del campo incluyen tanto valores de texto como numéricos y hay más texto que valores numéricos, se muestra el panel de frecuencia Valores más comunes. El conmutador de Frecuencia agrupada se proporciona cuando hay más de tres valores numéricos en el campo.
Cada panel de perfilado de Frecuencia de valores más comunes proporciona:
- Nombre del campo
- Cardinalidad (valores distintos)
- Valores más comunes y su frecuencia
- Otros frecuencia combinada de valores restantes
El panel Frecuencia de agrupamiento
El panel Frecuencia de agrupamiento muestra información de distribución y perfiles que es relevante para campos numéricos; incluidos los valores de datos mínimo, promedio y máximo. Si los datos del campo incluyen tanto texto como valores numéricos y hay más valores numéricos que de texto, se muestra el panel de Frecuencia de agrupamiento. El tipo de panel Frecuencia de valores más comunes está disponible para todos los campos que tienen valores no únicos.
Cada panel de perfilado de Frecuencia de agrupamiento proporciona:
- Nombre del campo
- Cardinalidad (valores distintos)
- Histograma que muestra la distribución de datos numéricos
- Valor mínimo
- Valor promedio (la suma de los números dividida por el número total de valores en el conjunto de datos)
- Valor máximo
Vista de la lista de perfiles
La vista de lista de perfiles proporciona una tabla con opciones de estadísticas de perfiles. Los usuarios comprueban las métricas de interés más significativas para el conjunto de datos en el selector de columnas , que puede encontrarse desplazándose hasta el extremo derecho de la tabla. Las nueve primeras estadísticas están predeterminadas.
La vista Datos de perfil
La vista de datos de perfil muestra su conjunto de datos como una tabla de datos simple con los nombres de columna de campo y (hasta) los primeros veinte valores.
Permisos
Se requieren permisos para perfilar y extraer muestras de datos. Debe tener un rol en el espacio del conjunto de datos que le permita perfilar las fuentes de datos. Para más información, vea Administrar permisos en espacios compartidos o Gestionar permisos en espacios administrados.