Histograma
También se conoce como: “Distribución”
Cómo aplicar este gráfico
En Power Bi
En Excel
Si requiere crear un gráfico en Excel, contacte a la Dirección de Visibilidad Digital (visibilidaddigital@uc.cl) para solicitar el tema del Kit de DataViz en formato THMX.
- Descargar el archivo .thmx que será proporcionado por la Dirección de Visibilidad Digital.
- Ir a Diseño de página o Disposición de página y elegir Temas.
- Hacer clic en Buscar temas, buscar el archivo .thmx y hacer clic en Aceptar.
- Si ya existe un gráfico, el tema se aplicará automáticamente. Si no, el gráfico que se construya usará los colores de tema y la fuente del mismo: Roboto. (Descargue aquí la fuente Roboto).
- El tema cargado quedará dentro de los Temas personalizados en el menú de temas.
Instalar en R
Este instructivo te guiará a través del proceso de descargar y procesar paletas de colores utilizando un código en el lenguaje de programación R.
Paso 1: Instalación de R y RStudio (si aún no están instalados).
Como hemos visto, si no tienes R instalado en tu computador, puedes descargarlo aquí. También se recomienda instalar RStudio, un entorno de desarrollo para R que facilita la escritura y ejecución de código R.
Paso 2: Instalar librerías.
Antes de ejecutar el código, necesitas instalar los paquetes requeridos. Copia y pega el siguiente código en la consola de RStudio y presiona Enter. Este comando instalará los paquetes necesarios para ejecutar el código. Asegúrate de estar conectado a Internet para que R pueda descargar e instalar los paquetes correctamente. Luego, puedes proceder con los pasos restantes del instructivo para descargar y procesar las paletas de colores.
Paso 3 Cargar librerías.
Para utilizar funciones de un paquete en R, primero debes cargarla en tu sesión de R. Puedes cargar bibliotecas usando la función library(). Recuerda que solo necesitas instalar un paquete una vez, pero debes cargarlo en cada sesión de R en la que la quieras utilizar.
Paso 4: Descargar el código.
Copiar y pegar el código en RStudio.
Paso 5: Ejecutar el código.
Selecciona todo el código y luego hacer click en el botón “Run” o presionar Ctrl + Enter (Windows) o Cmd + Enter (Mac) para ejecutar el código.
Paso 6: Resultados.
Después de ejecutar el código, deberías tener cargadas las paletas de colores en el objeto paletas_colores_uc. Puedes explorar y utilizar estos datos para crear visualizaciones de colores en R. ¡Y listo! Has completado con éxito el proceso de descargar y procesar la paletas de colores UC.
En programación, una función es fundamentalmente un bloque de código que realiza una tarea específicada por el usuario y que puede ser utilizada para optimizar procesos. En este caso particular, kit_digital_tema_3 es el nombre de la función que configura diferentes aspectos de los gráficos que un usuario del kit podrá utilizar, tales como los ejes, leyendas, facetas y paneles.
Una función en programación es como una receta. El usuario, en este caso, le entrega algunos instrucciones (entradas o argumentos) para realizar una serie de pasos que entregan un resultado (output de salida).
¿Cómo tendrás que cargar el tema? Copia y pega el siguiente código. Luego, cuando crees un gráfico con ggplot2, podrás aplicar este tema personalizado agregando + theme(mi_tema) al final de tu código, tal como iremos explicando en cada uno de los gráficos respectivamente.
Un usuario podrá importar sus propio datos para visualizar con el kit de visualización. Sin embargo, en esta oportunidad presentaremos un conjunto de datos de prueba con diferentes varibles para ir evaluando o demostrando la aplicación del tema en un gráfico respectivo.
Tal como hemos ido realizando en los pasos anteriores, copia y pega el siguiente código para luego ir construir el gráfico que consideres adecuado.
Cuándo usar este gráfico
Muestra la distribución de un conjunto de datos numéricos continuos. Consiste en una serie de barras adyacentes, donde cada una representa una clase o intervalo de valores y su altura indica la frecuencia o conteo de observaciones que caen dentro de este. El eje horizontal del histograma representa la variable que se está analizando, mientras que el eje vertical muestra la frecuencia absoluta o frecuencia relativa de las observaciones en cada clase.
Ventajas
- Los histogramas proporcionan una representación gráfica clara y visualmente intuitiva de la distribución de los datos. Permiten identificar rápidamente patrones, tendencias y características de los valores.
- Los histogramas permiten resumir grandes conjuntos de datos en una forma más concisa y fácil de interpretar.
- Los histogramas ayudan a identificar asimetrías en la distribución de los datos. También pueden resaltar valores atípicos o anomalías que se alejan de la tendencia general.
- Los histogramas pueden usarse para comparar visualmente la distribución de diferentes conjuntos de datos. Esto puede revelar diferencias significativas en las características y patrones de los valores.
Desventajas
- Tienen sensibilidad a la elección de intervalos, pues la forma en que se dividen los intervalos en un histograma puede afectar la apariencia y la interpretación de la distribución. Diferentes opciones de intervalos pueden llevar a diferentes conclusiones sobre los datos.
- Los histogramas resumen los datos y pueden perder información detallada sobre la variabilidad dentro de cada intervalo. No proporcionan una visión completa de los valores individuales.
- La interpretación de un histograma puede ser subjetiva y depender de la percepción visual del analista. Diferentes personas pueden interpretar los mismos datos de manera ligeramente diferente.
- Los histogramas son más adecuados para variables continuas, donde los datos se agrupan en rangos. No son tan efectivos para variables categóricas o discretas.
Recomendaciones
- Utilice una línea de base de valor cero. Dado que la frecuencia de los datos en cada contenedor está implícita en la altura de cada barra, cambiar la línea de base sesgará la percepción de la distribución de los datos.
- Pruebe diferentes tamaños de contenedores para ver cómo se ve la distribución en cada uno y luego elija el gráfico que represente mejor los datos. Si tiene demasiados contenedores, la distribución de datos se verá irregular y será difícil distinguir la señal del ruido. Si los contenedores son muy pocos el histograma carecerá de los detalles necesarios para discernir un patrón útil a partir de los datos.