Gráficos Boxplot (cajas y bigotes)

También se conoce como: Diagrama de cajas.


Cómo aplicar este gráfico

En Power Bi

warning El gráfico Boxplot no está disponible por el momento para Power Bi

En Excel

Si requiere crear un gráfico en Excel, contacte a la Dirección de Visibilidad Digital (visibilidaddigital@uc.cl) para solicitar el tema del Kit de DataViz en formato THMX.

  1. Descargar el archivo .thmx que será proporcionado por la Dirección de Visibilidad Digital.
  2. Ir a Diseño de página o Disposición de página y elegir Temas.
  3. Hacer clic en Buscar temas, buscar el archivo .thmx y hacer clic en Aceptar.
  4. Si ya existe un gráfico, el tema se aplicará automáticamente. Si no, el gráfico que se construya usará los colores de tema y la fuente del mismo: Roboto. (Descargue aquí la fuente Roboto).
  5. El tema cargado quedará dentro de los Temas personalizados en el menú de temas.

Instalar en R

Este instructivo te guiará a través del proceso de descargar y procesar paletas de colores utilizando un código en el lenguaje de programación R.

Paso 1: Instalación de R y RStudio (si aún no están instalados).

Como hemos visto, si no tienes R instalado en tu computador, puedes descargarlo aquí. También se recomienda instalar RStudio, un entorno de desarrollo para R que facilita la escritura y ejecución de código R.

Paso 2: Instalar librerías.

Antes de ejecutar el código, necesitas instalar los paquetes requeridos. Copia y pega el siguiente código en la consola de RStudio y presiona Enter. Este comando instalará los paquetes necesarios para ejecutar el código. Asegúrate de estar conectado a Internet para que R pueda descargar e instalar los paquetes correctamente. Luego, puedes proceder con los pasos restantes del instructivo para descargar y procesar las paletas de colores.

Paso 3 Cargar librerías.

Para utilizar funciones de un paquete en R, primero debes cargarla en tu sesión de R. Puedes cargar bibliotecas usando la función library(). Recuerda que solo necesitas instalar un paquete una vez, pero debes cargarlo en cada sesión de R en la que la quieras utilizar.

Paso 4: Descargar el código.

Copiar y pegar el código en RStudio.

Paso 5: Ejecutar el código.

Selecciona todo el código y luego hacer click en el botón “Run” o presionar Ctrl + Enter (Windows) o Cmd + Enter (Mac) para ejecutar el código.

Paso 6: Resultados.

Después de ejecutar el código, deberías tener cargadas las paletas de colores en el objeto paletas_colores_uc. Puedes explorar y utilizar estos datos para crear visualizaciones de colores en R. ¡Y listo! Has completado con éxito el proceso de descargar y procesar la paletas de colores UC.

En programación, una función es fundamentalmente un bloque de código que realiza una tarea específicada por el usuario y que puede ser utilizada para optimizar procesos. En este caso particular, kit_digital_tema_3 es el nombre de la función que configura diferentes aspectos de los gráficos que un usuario del kit podrá utilizar, tales como los ejes, leyendas, facetas y paneles.

Una función en programación es como una receta. El usuario, en este caso, le entrega algunos instrucciones (entradas o argumentos) para realizar una serie de pasos que entregan un resultado (output de salida).

¿Cómo tendrás que cargar el tema? Copia y pega el siguiente código. Luego, cuando crees un gráfico con ggplot2, podrás aplicar este tema personalizado agregando + theme(mi_tema) al final de tu código, tal como iremos explicando en cada uno de los gráficos respectivamente.

Un usuario podrá importar sus propio datos para visualizar con el kit de visualización. Sin embargo, en esta oportunidad presentaremos un conjunto de datos de prueba con diferentes varibles para ir evaluando o demostrando la aplicación del tema en un gráfico respectivo.

Tal como hemos ido realizando en los pasos anteriores, copia y pega el siguiente código para luego ir construir el gráfico que consideres adecuado.


Cuándo usar este gráfico

Se usa para representar la distribución de un conjunto de datos cuantitativos y resumir características importantes de estos. Corresponde a una representación gráfica de la distribución de los datos, que se basa en la información entregada por los “cinco números de resumen”: mínimo, Q1, mediana, Q3, y máximo.


Ventajas

  • Resume características importantes de la distribución de los datos, como la mediana, los cuartiles, el rango intercuartílico y los valores atípicos (outliers).
  • Este gráfico facilita la identificación de valores extremos (atípicos), ya que se representan como puntos individuales más allá de los ‘bigotes’ del boxplot.
  • Un gráfico de cajas y bigotes ayuda a comparar las distribuciones entre diferentes grupos o categorías; representando varios boxplots en el mismo gráfico.
  • Permite la evaluación de simetría, por medio de la posición de la mediana.

Desventajas

  • La información detallada sobre la forma exacta de la distribución es muy limitada.
  • No es adecuado para datos cualitativos, ya que está diseñado para datos numéricos.
  • Es sensible a los valores extremos, lo que puede afectar a la representación visual de la distribución.

Recomendaciones

  • Los diagramas de caja y bigotes realizan una comparación de distribuciones entre grupos, pero carecen de la capacidad de mostrar los detalles de la forma de una distribución de datos. Si tiene un solo grupo de datos, es mejor optar por un tipo de gráfico más detallado, como el histograma.