Saltar al contenido principal

Obtener perfiles de datos

Las estadísticas de perfil proporcionan análisis de columnas que miden la incidencia, los rangos y los valores que se dan dentro de los conjuntos de datos. Estas métricas describen relaciones entre valores de campo como:

  • Recuento de valores distintos (cardinalidad)
  • Valores de muestra, valores más comunes y frecuencia de valores
  • Redundancias útiles para identificar valores predeterminados o posibles duplicados
  • Recuentos de valores nulos, de cadena y numéricos
  • Información sobre rangos de valores que incluyen mínimo, máximo, promedio, suma y desviación estándar

Los administradores de datos acceden a información técnica sofisticada sobre sus conjuntos de datos desde la elaboración de perfiles. Esta información ayuda en la organización y asignación de recursos y acceso. Los desarrolladores de apps utilizan estadísticas de perfiles y muestreo de datos para obtener ideas y orientación para crear apps y planificar visualizaciones. La creación de perfiles de campo puede ayudar a los analistas de datos y a los usuarios de negocio a obtener conocimientos más rápidamente. Pueden ver y visualizar valiosas métricas de perfiles de campos sin necesidad de crear una app primero.

Catalog provides two different views of field profile data: List view and Tile view. List view is a tabular summary of configurable profile statistics and Tile view is a card-based, visual representation of fields laid out as a grid. Select the Tile Select tile icon for tile view or List Select list icon for list view icon to switch between profile views.

Vista de mosaico: Los campos se perfilan mediante métricas que son significativas para el tipo de datos contenidos en ese campo (por ejemplo: valores de texto versus valores numéricos)

Profile tile view

Vista de lista: Seleccione las estadísticas de perfiles de interés en el menú desplegable Columnas.

Profile list view

La vista Mosaico de perfiles

La vista Mosaico de perfiles es un perfil de campo visual diseñado para mostrar el contenido más informativo para ese tipo de campo. El tipo de panel de vista predeterminado que se muestra viene determinado por si el número de valores numéricos o de texto es mayor para ese campo. Por ejemplo, para campos que contengan valores de texto y también valores numéricos, el tipo de panel Valores más comunes se muestra de forma predeterminada si hay más valores de texto y el tipo de panel de distribución numérica Frecuencia agrupada se muestra si hay más valores numéricos en el campo. Se proporciona un conmutador desplegable para que pueda cambiar al tipo de panel Frecuencia de valores más comunes para cualquier campo que tenga valores no únicos cuando esté seleccionado A; o puede volver al panel de distribución numérica si se selecciona #1. Tenga en cuenta que todos los tipos de paneles incluyen el número de valores nulos, si el campo tiene valores nulos.

Paneles de la vista de mosaico: Frecuencia agrupada distribución numérica, Valores de muestra y Frecuencia de valores más comunes

Tile view profile cards

El panel Valores de muestra

El panel Valores de muestra se muestra cuando todos los valores son únicos y solo de texto. Enumerará (hasta) los primeros tres valores.

El panel Valores de muestra
Profile card sample values

Criterios de perfilado de los Valores de muestra: Los valores de campo se perfilan con este panel cuando la cardinalidad es alta (todos los valores son distintos). Si se diera el caso de que todos los valores fueran de texto y únicos, algunos valores de muestra proporcionan la mejor vista inicial de este tipo de datos de campo.

Cada panel de Valores de muestra proporciona: 

  • Nombre de campo
  • Cardinalidad
  • Hasta tres valores de muestra (los campos pueden tener menos de tres valores)

El panel Frecuencia de valores más comunes

El panel Frecuencia de valores más comunes muestra los dos valores más comunes y la frecuencia de esos valores y todos los demás valores combinados como Otro; a menos que solo haya tres valores, en cuyo caso los tres valores se muestran con la frecuencia de cada valor. Este panel de perfiles se puede aplicar a valores de datos de texto, numéricos o mixtos.

El panel de perfiles Frecuencia de valores más comunes con valores de texto
Profile card most common values frequency
El panel de perfiles Frecuencia de valores más comunes con valores numéricos
Profile card most common values

Criterios de Frecuencia de valores más comunes: Los campos que tienen pocos valores o una distribución de valores sesgada se perfilan contra el panel de frecuencia de valores más comunes. Este perfilado solo se aplica cuando hay varias instancias de los mismos valores. Los usuarios pueden obtener una visión rápida de la distribución de los valores de campo. Si los datos del campo incluyen tanto valores de texto como numéricos y hay más texto que valores numéricos, se muestra el panel de frecuencia Valores más comunes. El conmutador de Frecuencia agrupada se proporciona cuando hay más de tres valores numéricos en el campo.

Cada panel de perfiles Frecuencia de valores más comunes proporciona: 

  • Nombre de campo
  • Cardinalidad
  • Valores más comunes y su frecuencia
  • Otros frecuencia combinada de valores restantes

El panel Frecuencia agrupada

El panel Frecuencia agrupada muestra información de distribución y perfiles que es relevante para campos numéricos; incluidos los valores de datos mínimo, promedio y máximo. Si los datos del campo incluyen tanto texto como valores numéricos, y hay más valores numéricos que de texto, se muestra el panel de Frecuencia agrupada. El tipo de panel Frecuencia de valores más comunes está disponible para todos los campos que tienen valores no únicos.

El panel de perfiles Frecuencia agrupada
Profile card binned frequency

Cada panel de Frecuencia agrupada proporciona: 

  • Nombre de campo
  • Cardinalidad
  • Histograma que muestra la distribución de datos numéricos
  • Valor mínimo
  • Valor promedio (la suma de los números dividida por el número total de valores en el conjunto de datos)
  • Valor máximo

Vista de la lista de perfiles

La vista de lista de perfiles proporciona una tabla con opciones de estadísticas de perfiles. Los usuarios verifican las métricas de interés que son más significativas para el conjunto de datos que se perfila bajo Columns. Las primeras nueve estadísticas están preseleccionadas de forma predeterminada.

Desde la pestaña Inicio del centro de control, navegue hasta Sus datos; o desde Catálogo, filtre por TiposDatos.

  1. Seleccione Abrir conjunto de datos y a continuación seleccione Perfilar datos. Esta acción abrirá la página Perfil del conjunto de datos. Seleccione el botón Columnas y coloque una marca de verificación junto a las estadísticas de perfil de su interés. Estas estadísticas deben seleccionarse (con una marca de verificación junto a ellas) para que puedan perfilar el campo (columna) y aparecer en la tabla. La siguiente lista detalla las estadísticas de perfil disponibles.

    Estadísticas de perfil
    Estadística Descripción
    Nombre Nombre de campo (ejemplo: CategoryID)
    Tipo de datos

    Qlik Sense registra datos de muchos sistemas diferentes, se impone una correspondencia uniforme de tipo de datos externo a interno en los datos de campo (columna) con fines informativos. Los valores de tipo de datos admitidos incluyen:

    • Date: Una fecha que contiene mes, día, año en formato ISO 8601 de AAAA-MM-DD

    • Time: Un valor de tiempo que contiene horas, minutos y segundos en formato ISO 8601 de hh.mm.ss.sss±hh:mm
    • Datetime: Un valor de fecha y hora que contiene año, mes, día, hora, minuto, segundo y fracciones en formato de AAAA-MM-DDThh.mm.ss.sss
    • Timestamp: Un valor de tiempo que contiene año, mes, día, hora, minuto, segundo, fracciones y zona horaria en el siguiente formato: AAAA-MM-DDThh.mm.ss.sssZ
    • String: Datos de caracteres que representan texto
    • Double: Un tipo de datos numéricos con punto flotante IEEE 754 de 64 bits de doble precisión
    • Decimal: Un tipo de datos numérico exacto definido por su precisión (número total de dígitos) y escala (número de dígitos a la derecha del punto decimal)
    • Integer: Números enteros positivos o negativos
    • Boolean: Un valor booleano (VERDADERO/FALSO)
    • Binary: Datos categóricos que pueden tomar exactamente dos valores posibles, como "1" y "2"
    • Custom: Tipo que está fuera del tipo conocido del sistema asignado
    Valores distintos Cardinalidad, número de valores distintos presentes para este campo
    Valores de muestra Valores de muestra (visualización de 3 valores de muestra)
    Suma Suma de todos los valores de este campo (se muestra "0" para los campos de cadena)
    Mín Valor mínimo observado para este campo (campos numéricos)
    Máx Valor máximo observado para este campo (campos numéricos)
    Media Valor promedio observado para este campo
    Etiquetas del sistema Etiquetas de archivo aplicadas para identificar el conjunto de códigos (por ejemplo, $ascii, $text)
    Desviación estándar Desviación estándar para campos numéricos
    Positivos Número de valores positivos
    Negativos Número de valores negativos
    Valores cero Número de valores "0"
    Cadenas vacías Número de cadenas vacías
    Longitud mínima Longitud de carácter más baja observada
    Longitud media Longitud promedio de caracteres observados
    Longitud máxima Longitud de carácter más alta observada
    Primer valor ordenado El primer valor (más bajo) del peso de clasificación (campos de cadena)
    Último valor ordenado El último valor (más alto) del peso de clasificación (campos de cadena)
    Valores numéricos Número de valores numéricos
    Valores de texto Número de valores de texto
    Valores más frecuentes Los tres valores más comunes del campo

Muestras de datos

Una muestra de datos es un subconjunto de un conjunto de datos de población. Es una herramienta útil para que los administradores de datos se aseguren de que los datos se ajustan a los patrones y al formato esperados. Los creadores de apps pueden hacerse una idea de los campos y de los datos de campo dentro del contexto de otros registros y el conjunto de datos. Estas vistas ofrecen un primer vistazo a los datos; los desarrolladores pueden comenzar a explorar los datos para su análisis y posibles correlaciones.

Seleccione Muestra de datos para ver una muestra de los primeros 20 valores de datos para cada campo

Dataset engine sample
  • Seleccione el botón icon dropdown arrow y después Muestra para ver una muestra (n=20) de valores de datos para cada campo.

Permisos

Se requieren permisos para perfilar y extraer muestras de datos. La acción de crear perfiles de mapas de datos para el permiso más amplio Perfilar fuente de datos. Para más información, vea Administrar permisos en espacios compartidos o Gestionar permisos en espacios administrados.

  • Perfilar datos > Perfilar fuente de datos

Ejemplo