Diagrama de caja
El diagrama de caja es adecuado para comparar el intervalo y la distribución de conjuntos de datos numéricos, ilustrados mediante una caja con bigotes y una línea central en el medio. Los bigotes representan los valores de referencia altos y bajos, para excluir los valores atípicos.
Puede definir los puntos de inicio y fin de la caja y los rangos de los bigotes con unos cuantos valores preestablecidos distintos o bien definir sus propios parámetros mediante el uso de expresiones.
- Primer bigote
- Inicio de caja
- Línea central
- Fin de caja
- Último bigote
Cuándo se utiliza
El diagrama de caja es adecuado para comparar el rango y la distribución en conjuntos de datos numéricos.
Ventajas: el diagrama de caja organiza grandes cantidades de datos y visualiza valores atípicos.
Desventajas: el diagrama de caja no es relevante para el análisis detallado de los datos, ya que se trata de un resumen de la distribución de los datos.
De manera predeterminada se utiliza la configuración preestablecida Estándar (Tukey).
Cambiar la definición del diagrama de caja
Para definir su diagrama de caja puede utilizar una de las tres configuraciones preestablecidas de valores que se encuentran en el panel de propiedades, en Elementos del diagrama de caja.
Estándar (Tukey)
Este preajuste se basa en la definición original del diagrama de caja de J. Tukey. La línea central representa la mediana (segundo cuartil) y los puntos de inicio y fin de la caja representan el primer y el tercer cuartil. La longitud del bigote se puede configurar en 1, 1,5 o 2 rangos intercuartílicos. Un rango intercuartílico representa la diferencia entre el primer y tercer cuartil.
Basado en percentil
Esta configuración preestablecida también viene definida con los puntos de inicio y fin de la caja que representan el primer y el tercer cuartil, y la línea central que representa la mediana, pero la longitud del bigote se ajusta configurando un percentil basado en la posición del bigote.
Desviación estándar
Esta configuración preestablecida se basa en desviaciones estándar, la línea central representa el valor promedio y los puntos de inicio y fin de la caja representan una varianza de desviación estándar. Puede configurar la longitud del bigote en un múltiplo de las desviaciones estándar.
También puede definir un diagrama de caja personalizado donde indique el valor de cada elemento del diagrama de caja usando una expresión.