{ggplot2}
Principales conceptos y funciones para visualizar datos con R
2024-03-20
🍀 Linktree
🔗 Web
✅ Conceptos básicos de R
✅ Pensar un proyecto de datos con R
✅ Procesamiento de datos con {tidyverse}
📌 ¿Por qué visualizar datos?
📌 Gramática de los gráficos y {ggplot2}
- Capas y el operador `+` (más)
📌 Armando un gráfico de barras (columnas)
- Función `geom_col()`
📌 Chapa y pintura de un gráfico (atributos)
Armar un proyeto de trabajo nuevo o abrir aquel con el que veníamos trabajando
Cargar la base del Padrón Único Nacional de Alojamientos (Argentina) y chequear que esté en la carpeta datos
Crear un script de trabajo
Carga la librería {tidyverse}
Una forma de visualizar
{ggplot2}
?{ggplot2}
?Tiene un marco de referencia (El grammar of graphics)
Flexible, con especificaciones a nivel de capas.
Sistema de themes
, que permiten pulir la apariencia del gráfico
Decenas de extensiones para ampliar la potencia del paquete
Comunidad activa y con mucha predisposición a ayudar.
# Preparo los datos
df_habitaciones_2022 <- df_puna |>
filter(indice_tiempo == 2022) |>
group_by(tipo) |>
summarise(habitaciones_n = sum(habitaciones, na.rm = T))
ggplot(data = df_habitaciones_2022,
mapping = aes(x = tipo,
y = habitaciones_n)) +
geom_col(aes(fill = tipo)) +
geom_text(aes(label = habitaciones_n,
vjust = -0.5)) +
geom_hline(yintercept = 0) +
labs(title = "Cantidad de habitaciones por tipo de alojamiento",
subtitle = "Argentina, año 2021",
x = "",
y = "Cantidad de habitaciones",
caption = "Fuente: PUNA - MINTURyDEP",
fill = "Tipo de alojamiento") +
theme_minimal() +
theme(legend.position = "none")
o…
3 Capas son las indispensables al pensar nuestro gráfico:
Los datos (argumento: data =
):
Los datos (argumento: data =
):
Las aesthetics (función aes()
:
Los datos (argumento: data =
):
Las aesthetics (función aes()
:
Las geometrías (función geom_*()
:
Preparo los datos:
ggplot(data = df_habitaciones_2022,
aes(x = tipo, y = habitaciones_n)) +
geom_col(aes(fill = tipo),
color = "black") +
labs(title = "Cantidad de habitaciones por tipo de alojamiento",
subtitle = "Argentina, año 2022",
x = "",
y = "Cant. de habitaciones",
caption = "Fuente: Elaboración propia en base al PUNA-MINTURyDEP")
ggplot(data = df_habitaciones_2022,
aes(x = tipo, y = habitaciones_n)) +
geom_col(aes(fill = tipo),
color = "black") +
labs(title = "Cantidad de habitaciones por tipo de alojamiento",
subtitle = "Argentina, año 2022",
x = "",
y = "Cant. de habitaciones",
caption = "Fuente: Elaboración propia en base al PUNA-MINTURyDEP") +
theme_minimal()
ggplot(data = df_habitaciones_2022,
aes(x = tipo, y = habitaciones_n)) +
geom_col(aes(fill = tipo),
color = "black") +
labs(title = "Cantidad de habitaciones por tipo de alojamiento",
subtitle = "Argentina, año 2022",
x = "",
y = "Cant. de habitaciones",
caption = "Fuente: Elaboración propia en base al PUNA-MINTURyDEP") +
theme_minimal() +
theme(legend.position = "none")