Introducción al Análisis de la Encuesta Permanente de Hogares (EPH) con R

Betsabe Cohen & Andrea Gómez Vargas

Facultad de Ciencias Sociales - UBA

2023-07-09

¡Hola 👋!

Andrea

  • Socióloga (UBA)
  • Analista de Estadísticas de Polación en INDEC
  • R-Ladies Global Team

Betsy

  • Socióloga (UBA)
  • Analista de datos en el Ministerio de Cultura de la Nación
  • R-Ladies Buenos Aires

R-Ladies

Es una organización mundial que promueve la diversidad de género en la comunidad R.

Nuestra meta es crear una atmósfera amigable para personas interesadas en programar en R y que se identifiquen con géneros menos representados en la comunidad de R (que incluye pero no se limita a mujeres cis/trans, hombres trans, personas no binarias, género fluído o agénero). El objetivo es promover su uso, intercambiar conocimiento y crear una red de contactos a nivel local y global.

Nucleo de innovación Social (NIS)

Es un hub de investigación y desarrollo interdisciplinario que lleva adelante acciones que promueven el diálogo de saberes entre las ciencias sociales y la tecnología, articulando con organizaciones públicas, privadas y de la sociedad civil.

¿Qué vamos a ver hoy?

  • Acerca de la Encuesta Permanente de Hogares (EPH)
  • R & Rstudio
  • Ejercicio con indicadores de mercado de trabajo
    • Extracción de datos de la librería {EPH}
    • Calculo de indicadores con la librería {tidyverse}
    • Tablas con la librería {gt}

Qué es la EPH

La Encuesta Permanente de Hogares (EPH) es un programa nacional de producción sistemática y permanente de indicadores sociales que lleva a cabo el Instituto Nacional de EstadÌstica y Censos (INDEC) con las direcciones provinciales de estadística (DPE).


Tiene por objeto relevar las características sociodemográficas y socioeconómicas de la población. En su modalidad original se ha aplicado en la Argentina desde 1973 a través de la medición puntual de dos ondas anuales (mayo y octubre).



A partir de 2003, la EPH pasó a ser un relevamiento continuo que produce datos con frecuencia trimestral.


Cabe señalar que en base a esta encuesta se proporcionan regularmente, entre otros resultados, las tasas oficiales de empleo, desocupación, subocupación y pobreza.

Características de la muestra


La EPH se basa en una muestra probabilística, estratificada, en dos etapas de selección. Dicha muestra está distribuida a lo largo del período respecto del cual se brinda información (el trimestre) y el relevamiento se desarrolla durante todo el año


La encuesta produce estimaciones trimestrales válidas para:

  • Cada uno de los 31 aglomerados urbanos (todas las capitales de provincias + aquellos aglomerados con +100.000 habitantes).

La encuesta produce estimaciones trimestrales válidas para:

  • Total de 31 aglomerados agrupados.
  • Aglomerados del interior: todos los aglomerados, excluido el Gran Buenos Aires.
  • Conjunto de aglomerados agrupados en 6 regiones estadísticas (Región Gran Buenos Aires, Región Cuyo, Región Noreste (NEA), Región Noroeste (NOA), Región Pampeana, Región Patagonia).
  • Conjunto de aglomerados con 500.000 y más habitantes.

Características del diseño de la muestra


La EPH es una encuesta por muestreo. Esto significa que para conocer las diversas características del total de los hogares, se encuesta una pequeña fracción representativa de los mismos. La aplicación de rigurosas técnicas estadísticas permite garantizar la precisión de los datos así obtenidos.

Los hogares que serán encuestados son seleccionados de forma aleatoria en dos etapas de selección:

  • En la primer etapa, dentro de cada aglomerado, se selecciona una cantidad de radios censales o subdivisiones de los mismos (áreas).
  • En la segunda etapa se listan todas las viviendas particulares de las áreas seleccionadas, para efectuar a partir de ese listado una selección aleatoria de viviendas. Los hogares que habitan esas viviendas son los hogares a encuestar.
  • La cantidad de viviendas a seleccionar en cada área, es igual dentro de cada aglomerado.

Características de la EPH


¿De quiénes habla?:

  • La encuesta representa al 65% del total de la población.
  • Una vez al año se releva la EAHU, extensión de la EPH al 100% de la población urbana (localidades de 2.000 y más habitantes, que al último censo disponible -2010-, el 90% de la población residía en estas localidades).

Principales temáticas abordadas


  • Características demográficas básicas
  • Características ocupacionales
  • Características migratorias
  • Características habitacionales
  • Características educacionales
  • Características de ingreso

Cuestionarios

Cuestionario Vivienda

Cuestionario del Hogar

Cuestionario Individual

R & RStudio

¿Qué es R?

  • Lenguaje para el procesamiento y análisis estadístico de datos
  • Software Libre
  • Sintaxis Básica: R base
  • Sintaxis incremental: El lenguaje se va ampliando por aportes de Universidades, investigadores/as, usuarios/as y empresas privadas, organizados en librerías (o paquetes).
  • Graficos con calidad de publicación

RStudio


- El entorno más cómodo para utilizar el lenguaje R es el programa R studio

  • Posit es una empresa que produce productos asociados al lenguaje R, como el programa sobre el que corremos los comandos, y extensiones del lenguaje (librerías).

  • El programa es gratuito y se puede bajar de la página oficial

IDE

Interfaz

paquetes de trabajo

Ahora manos al código

Documento 02_practicaEPH.html

Preguntas

Gracias