Tidyverse, parte I - Ejercitación

Author

Estación R

Preparación: Para resolver los siguientes ejercicios es necesario tener la base de la EPH individual cargada en el ambiente de R. Podés cargarla con read_csv() o con el paquete {eph}.

Referencia de variables

Variable Significado Valores
CH04 Sexo 1=Varón, 2=Mujer
CH06 Edad Años cumplidos
ESTADO Condición de actividad 1=Ocupado, 2=Desocupado, 3=Inactivo
CAT_OCUP Categoría ocupacional 1=Patrón, 2=Cta. propia, 3=Asalariado
NIVEL_ED Nivel educativo 1 a 7
P21 Ingreso ocupación principal En pesos
REGION Región estadística 1=GBA, 40=NOA, 41=NEA, 42=Cuyo, 43=Pampeana, 44=Patagonia

Consigna:

  1. Necesito quedarme con la población ocupada (ESTADO == 1). Reemplazar los campos _____ de la siguiente sentencia y comprobar que la operación fue exitosa:
### Cargo el paquete
library(tidyverse)

### Cargo la base de datos
eph_ind <- read_csv("datos/eph_individual.csv")

eph_ocupados <- eph_ind |>
  ______(CH04, CH06, ESTADO, _____) |>
  filter(_____ == 1)
  • ¿Cuántas personas ocupadas hay? (Tip: usar nrow())
  1. Crear un objeto que contenga sólo las variables CH04, CH06, NIVEL_ED y P21, y los casos de mujeres (CH04 == 2), únicamente.
  • Chequear que la operación fue exitosa (verificar columnas y filas).
  1. Filtrar la base para quedarse con la población desocupada (ESTADO == 2) de la región pampeana (REGION == 43).
  • ¿Cuántas personas desocupadas hay en esa región?
  1. Desafío: Usando select() y filter(), crear un objeto con las variables CH04, CH06, ESTADO, REGION y P21, que contenga solamente a los varones ocupados mayores de 30 años de GBA y Patagonia (REGION %in% c(1, 44)).
  • ¿Cuántas personas cumplen todas esas condiciones?
Back to top