Ciencia de datos y acceso abierto

Nueva herramienta en R para el análisis de microdatos del Censo 2022

Desarrollado por un investigador del INENCO, el paquete censo2022arg permite acceder, procesar y analizar información censal de manera directa, sin necesidad de utilizar REDATAM.


El Instituto de Investigaciones en Energía No Convencional (INENCO, CONICET–UNSa) informa la publicación del paquete censo2022arg en el repositorio oficial de R (CRAN), una herramienta orientada al acceso, procesamiento y análisis de los microdatos del Censo Nacional de Población, Hogares y Viviendas 2022 de la República Argentina.

El desarrollo fue realizado por el Dr. Rodrigo Duran, integrante del Grupo de Eficiencia Energética y Desarrollo Socio-Productivo del INENCO, y se inscribe en una línea de trabajo orientada a fortalecer el uso de datos abiertos y herramientas reproducibles para la investigación científica y la toma de decisiones basada en datos.

El paquete permite trabajar con los microdatos censales directamente en el entorno R, sin requerir conocimiento de la sintaxis del software REDATAM. A través de un flujo de trabajo estructurado, automatiza las principales etapas técnicas del procesamiento de datos: descarga de bases y metadatos desde el repositorio oficial del INDEC, extracción de microdatos, reconstrucción de identificadores jerárquicos (vivienda, hogar y persona), aplicación de etiquetas a partir de diccionarios oficiales y verificación de la consistencia de la información respecto de los totales publicados.

Como resultado, los usuarios acceden a un objeto de datos en formato estándar de R, listo para su análisis mediante herramientas ampliamente utilizadas en ciencia de datos, como dplyr, ggplot2 o data.table, entre otras. Asimismo, el paquete contempla criterios de eficiencia en la gestión de memoria y permite la exportación de datos en distintos formatos, favoreciendo su interoperabilidad con otros entornos de análisis.

Este tipo de desarrollos contribuye a ampliar las capacidades de análisis de información socio-demográfica en el ámbito científico-tecnológico, y resulta de particular interés para investigaciones vinculadas a la planificación territorial, el análisis socioambiental y las políticas públicas.

El paquete se encuentra disponible para su consulta y descarga en los siguientes enlaces:

Repositorio del proyecto:
https://github.com/RodriDuran/censo2022arg
Manual de referencia (CRAN):
https://cran.r-project.org/web/packages/censo2022arg/censo2022arg.pdf
Guía de uso (viñeta):
https://cran.r-project.org/web/packages/censo2022arg/vignettes/censo2022arg.html

Para consultas técnicas o mayor información, se puede contactar al Dr. Rodrigo Duran a través del correo electrónico: rodrigo.duran@exa.unsa.edu.ar.