Tidyverse, parte I - Ejercitación
Preparación: Para resolver los siguientes ejercicios es necesario tener la base de la EPH individual cargada en el ambiente de R. Podés cargarla con
read_csv()o con el paquete{eph}.
Referencia de variables
| Variable | Significado | Valores |
|---|---|---|
CH04 |
Sexo | 1=Varón, 2=Mujer |
CH06 |
Edad | Años cumplidos |
ESTADO |
Condición de actividad | 1=Ocupado, 2=Desocupado, 3=Inactivo |
CAT_OCUP |
Categoría ocupacional | 1=Patrón, 2=Cta. propia, 3=Asalariado |
NIVEL_ED |
Nivel educativo | 1 a 7 |
P21 |
Ingreso ocupación principal | En pesos |
REGION |
Región estadística | 1=GBA, 40=NOA, 41=NEA, 42=Cuyo, 43=Pampeana, 44=Patagonia |
Consigna:
- Necesito quedarme con la población ocupada (
ESTADO == 1). Reemplazar los campos_____de la siguiente sentencia y comprobar que la operación fue exitosa:
### Cargo el paquete
library(tidyverse)
### Cargo la base de datos
eph_ind <- read_csv("datos/eph_individual.csv")
eph_ocupados <- eph_ind |>
______(CH04, CH06, ESTADO, _____) |>
filter(_____ == 1)- ¿Cuántas personas ocupadas hay? (Tip: usar
nrow())
- Crear un objeto que contenga sólo las variables
CH04,CH06,NIVEL_EDyP21, y los casos de mujeres (CH04 == 2), únicamente.
- Chequear que la operación fue exitosa (verificar columnas y filas).
- Filtrar la base para quedarse con la población desocupada (
ESTADO == 2) de la región pampeana (REGION == 43).
- ¿Cuántas personas desocupadas hay en esa región?
- Desafío: Usando
select()yfilter(), crear un objeto con las variablesCH04,CH06,ESTADO,REGIONyP21, que contenga solamente a los varones ocupados mayores de 30 años de GBA y Patagonia (REGION %in% c(1, 44)).
- ¿Cuántas personas cumplen todas esas condiciones?