Diagrama de distribución

El diagrama de distribución es adecuado para comparar intervalos y distribución en conjuntos de datos numéricos. Los datos se trazan como puntos de valores a lo largo de un eje. Puede elegir entre mostrar solo puntos de valores para ver la distribución de valores, un cuadro delimitador para ver el rango de valores o una combinación de ambos, tal como se muestra aquí:

Distribution plot.

Cuándo se utiliza

El diagrama de distribución es adecuado para comparar intervalos y distribución en conjuntos de datos numéricos.

Ventajas

El diagrama de distribución visualiza la distribución de datos.

Desventajas

El diagrama de distribución no es bueno para un análisis detallado de los datos, pues opera con un resumen de la distribución de datos.

Crear un diagrama de distribución

Puede crear un diagrama de distribución en la hoja que está editando.

En un diagrama de distribución necesita usar una o dos dimensiones y una medida. Si utiliza una única dimensión, recibirá una visualización de una sola línea. Si utiliza dos dimensiones, obtendrá una línea por cada valor de la segunda dimensión o dimensión externa.

Haga lo siguiente:

  1. Desde el panel de activos, arrastre un diagrama de distribución vacío a la hoja.
  2. Agregue la primera dimensión.

    Esta es la dimensión interna, que define los puntos de valores.

  3. Agregue una segunda dimensión.

    Esta es la dimensión externa, la cual define los grupos de puntos de valores mostrados en el eje de la dimensión.

  4. Haga clic en Añadir medida y cree una medida a partir de un campo.

Cuando haya creado el diagrama de distribución, puede mejorar su aspecto y hacer otros ajustes en el panel de propiedades.

Limitaciones de visualización

Mostrar grandes cantidades de datos en un gráfico de distribución

Cuando mostramos grandes cantidades de datos en un gráfico de distribución, aparece el mensaje: "Actualmente se muestra un conjunto de datos limitado" para indicar que no se están mostrando todos los datos.

  • Si el gráfico utiliza más de una dimensión, se muestran 3000 puntos de datos.