Gráficos de dispersión (Scatterplot)

También se conoce como: diagrama de dispersión, scatterplot


Cómo aplicar este gráfico

En Power Bi

En Power BI Desktop
  1. Descargar el archivo JSON del tema.
  2. En la ventana de Vista de informe, ir a Vista, elegir Tema, y seleccionar Explorar Tema.
  3. Ir a la ubicación donde se guardó el archivo de tema JSON y seleccionar Abrir.
  4. En la página Tema del panel, seleccionar Guardar. El nuevo tema se aplicará al panel.
En el servicio Power BI
  1. Descargar el archivo JSON del tema.
  2. En la ventana del tema Panel personalizado, seleccionar Cargar tema JSON.
  3. Ir a la ubicación donde se guardó el archivo de tema JSON y seleccionar Abrir.
  4. En la página Tema del panel, seleccionar Guardar. El nuevo tema se aplicará al panel.

En Excel

  1. Descargar el archivo .thmx.
  2. Ir a Diseño de página o Disposición de página y elegir Temas.
  3. Hacer clic en Buscar temas, buscar el archivo .thmx y hacer clic en Aceptar.
  4. Si ya existe un gráfico, el tema se aplicará automáticamente. Si no, el gráfico que se construya usará los colores de tema y la fuente del mismo: Roboto. (Descargue aquí la fuente Roboto).
  5. El tema cargado quedará dentro de los Temas personalizados en el menú de temas.

Instalar en R

Este instructivo te guiará a través del proceso de descargar y procesar paletas de colores utilizando un código en el lenguaje de programación R.

Paso 1: Instalación de R y RStudio (si aún no están instalados).

Como hemos visto, si no tienes R instalado en tu computador, puedes descargarlo aquí. También se recomienda instalar RStudio, un entorno de desarrollo para R que facilita la escritura y ejecución de código R.

Paso 2: Instalar librerías.

Antes de ejecutar el código, necesitas instalar los paquetes requeridos. Copia y pega el siguiente código en la consola de RStudio y presiona Enter. Este comando instalará los paquetes necesarios para ejecutar el código. Asegúrate de estar conectado a Internet para que R pueda descargar e instalar los paquetes correctamente. Luego, puedes proceder con los pasos restantes del instructivo para descargar y procesar las paletas de colores.

Paso 3 Cargar librerías.

Para utilizar funciones de un paquete en R, primero debes cargarla en tu sesión de R. Puedes cargar bibliotecas usando la función library(). Recuerda que solo necesitas instalar un paquete una vez, pero debes cargarlo en cada sesión de R en la que la quieras utilizar.

Paso 4: Descargar el código.

Copiar y pegar el código en RStudio.

Paso 5: Ejecutar el código.

Selecciona todo el código y luego hacer click en el botón “Run” o presionar Ctrl + Enter (Windows) o Cmd + Enter (Mac) para ejecutar el código.

Paso 6: Resultados.

Después de ejecutar el código, deberías tener cargadas las paletas de colores en el objeto paletas_colores_uc. Puedes explorar y utilizar estos datos para crear visualizaciones de colores en R. ¡Y listo! Has completado con éxito el proceso de descargar y procesar la paletas de colores UC.

En programación, una función es fundamentalmente un bloque de código que realiza una tarea específicada por el usuario y que puede ser utilizada para optimizar procesos. En este caso particular, kit_digital_tema_3 es el nombre de la función que configura diferentes aspectos de los gráficos que un usuario del kit podrá utilizar, tales como los ejes, leyendas, facetas y paneles.

Una función en programación es como una receta. El usuario, en este caso, le entrega algunos instrucciones (entradas o argumentos) para realizar una serie de pasos que entregan un resultado (output de salida).

¿Cómo tendrás que cargar el tema? Copia y pega el siguiente código. Luego, cuando crees un gráfico con ggplot2, podrás aplicar este tema personalizado agregando + theme(mi_tema) al final de tu código, tal como iremos explicando en cada uno de los gráficos respectivamente.

Un usuario podrá importar sus propio datos para visualizar con el kit de visualización. Sin embargo, en esta oportunidad presentaremos un conjunto de datos de prueba con diferentes varibles para ir evaluando o demostrando la aplicación del tema en un gráfico respectivo.

Tal como hemos ido realizando en los pasos anteriores, copia y pega el siguiente código para luego ir construir el gráfico que consideres adecuado.


Cuándo usar este gráfico

Sirve para la representación gráfica de datos utilizando puntos para mostrar la relación entre dos variables. Cada punto, en el gráfico, representa una observación o un par de valores correspondientes a las dos variables en estudio. Por lo general, se utiliza en el análisis de datos para visualizar la relación entre las dos variables, puesto que además de informar los valores de los puntos de datos individuales, también muestra los patrones cuando los datos se toman en su conjunto.


Ventajas

  • Es útil para identificar valores atípicos o anomalías en los datos que se desvían significativamente de la tendencia general.
  • Cuando se utiliza un scatterplot para visualizar dos variables con subclasificaciones, se pueden utilizar colores, formas o tamaños diferentes para representar cada variable, permitiendo explorar posibles interacciones o patrones complejos entre estas.
  • Los scatterplots son fáciles de entender y comunicar, lo que los convierte en una herramienta efectiva para presentar hallazgos a audiencias no técnicas o para la divulgación de resultados.

Desventajas

  • La interpretación de un diagrama de dispersión puede ser subjetiva, ya que se basa en la percepción visual. Diferentes personas pueden interpretar los mismos datos de manera ligeramente diferente.
  • Si el conjunto de datos es muy grande, los puntos en el scatterplot pueden superponerse y dificultar la interpretación.
  • Aunque el scatterplot muestra la relación entre dos variables, no implica necesariamente causalidad. Solo muestra la asociación entre las variables, pero no permite establecer una relación causal directa.

Recomendaciones

Sobre los datos
  • Una forma de aliviar la superposición o sobretrazado es usar un subconjunto de puntos de datos: una selección aleatoria de puntos debería dar una idea general de los patrones en los datos completos.
  • Si se desea agregar una tercera variable numérica se recomienda utilizar el gráfico de burbujas.