Obtuvimos los datos del Censo 2017 y los revisamos en Geometadatos

Los obtuvimos, revisamos y desarrollamos mapas temáticos. El Censo 2017 en su formato de microdatos es probablemente el conjunto de datos mas esperado en consideración a sus predecesores, un censo 2002 que aunque vigente para estudios de políticas públicas pierde potencia en la medida que avanzan los años y un censo 2012 que, sin mayor historia o juicio de valor, no es una medición 100% confiable. Existen algunas novedades interesantes a la hora de manejar esta base de datos utilizada por todos los sectores que representan el avance sustantivo de la institución en la presentación, consulta y manejo de los datos espaciales.

Para nuestro ejercicio, nos basamos en la información disponible en su sitio web, específicamente los sitios de acceso a microdatos y su base cartográfica. Además seguimos las recomendaciones de su página web y fuimos a retirar su base de datos a dependencias del INE (en un DVD simple).

¿Qué obtuvimos?

Si descargamos y compilamos toda la información disponible obtenemos:

De la página web:

  • Base de datos cartográfica en formato Shapefile para cada región de los elementos espaciales del Censo:
    • División Político Administrativa (Región, Provincia, Comuna, Límites DPA)
    • Base de Datos de Calles y Rutas
    • Límite Urbano Censal (Polígono)
    • Divisiones Censales (Distritos, Zonas, Entidades, Manzanas, Localidades)
  • Base de Datos Manzana-Entidad en formato CSV con información desagregada al nivel censal mas específico
  • Manuales de Usuario de Base de Datos Censo 2017
  • Documentación Complementaria

Del DVD:

  • Base de Datos en formato CSV, Redatam y SPSS (Sintaxis de Carga) de Hogares, Personas y Viviendas incluyendo etiquetas para diccionario de datos
  • Manuales de Usuario de Base de Datos Censo 2017
  • Documentación Complementaria

Aspectos Relevantes

Disgregación Cartográfica Regional

Un problema, o mas bien trabajo extra, que se nos presentó fue consolidar la información regional para llegar a una base de datos nacional. Si bien es cierto cada conjunto de datos regional incluye la misma estructura de datos (con algunas sutiles diferencias de nombre) el trabajo de consolidar no es menor, toma tiempo y para ello usamos ArcGIS Pro con la función Merge.

CensoGMD1

Considerando que son 13 capas por región, a nivel nacional se manejan 195 Shapefiles. Dependerá de cada usuario manejar la base de datos que requiera, en este artículo trabajamos con el máximo de capas posible.

Indeterminación Geográfica e Innominación.

Los datos del Censo están sujetos al Secreto Estadístico por lo que no reflejan datos personales ni elementos que permitan localizar a una persona específica en la entrega de los datos, sin embargo, en esta oportunidad tenemos un nuevo elemento que es altamente recomendable manejar para este censo que es la Indeterminación Geográfica.

En la página 19 del manual del usuario del Censo (Capítulo IV) se habla de la indeterminación de la base de datos, un proceso de cumplimiento de la ley 17.374 sobre los alcances del secreto estadístico. A diferencia del Censo 2002, el Censo 2017 es entregado a nivel de detalle geográfico de zona-localidad y no a nivel de manzana. Esto se puede comprobar revisando el diccionario de datos en formato REDATAM donde el nivel de manzana no aparece la Manzana/Entidad como nivel jerárquico.

CensoGMD2

Esto impide que se puedan hacer resúmenes estadísticos a estos niveles para datos de vivienda, hogar y persona.

Para los usuarios que aun requieran trabajar a nivel manzana/entidad se dispuso una tabla complementaria llamada Base de Datos Manzana-Entidad la cual dispone de información de resumen a este nivel con algunas limitaciones (marcadas con asteriscos en la base de datos) que garantizan la indeterminación geográfica antes conversada. Si consideras que esto es un beneficio o una limitación indícanos en los comentarios.

Manzent y Geocódigo

Habiendo conocido la indeterminación geográfica y la limitación de análisis a nivel manzana, empezamos a trabajar con el Geocódigo, el cual es un código que sigue la misma lógica del código Manzana/Entidad (Manzent) utilizado en el censo 2002. El Manzent sigue siendo utilizado hoy en día y puede ser encontrado en los Shapefiles de Manzanas (IND y SIN_INF) y Entidad (Para zonas rurales), pero en el nivel geográfico superior de Localidades (Para áreas rurales) y Zonas (Para áreas urbanas) encontramos el Geocódigo el cual se compone del código de comuna (RRPCC) + Distrito Censal Urbano (1) o Rural (2) + Código de Zona o Localidad según corresponda:

Geocódigo = RRPPCCDLLL

R=Región; P=Provincia; C=Comuna; D=Distrito Censal; L=Zona o Localidad

Con el Geocódigo podemos realizar cruces de información entre los Shapefiles de Zonas y Localidades con las bases de datos de Hogar, Persona y Vivienda disponibles en el DVD de la base de datos, aunque previamente se requeriría construir el Campo de Geocódigo. Utilizando Python elaboramos una función simplificada para el cálculo del geocódigo usando como variables los datos de Comuna Distrito Area y Zona/Localidad


#Test Values
com=5101
dc=1
ar=1
zone=2
#ArcGIS CodeBlock
def GEOCODIGO(comuna,distrito,area,zona):
c=str(comuna)
d=str(distrito)
a=str(area)
z=str(zona)
#Distrito
if distrito > 9:
d2=d
else: d2=str("0")+d
#Zona
if zona > 9 and zona < 100:
z2=str("0")+z
elif zona > 99 and zona < 1000:
z2=z
elif zona < 10:
z2=str("00")+z
#Codigo
codigo=c+d2+a+z2
return codigo
#Test
valor= GEOCODIGO(com,dc,ar,zone)
print valor

view raw

geocódigo.py

hosted with ❤ by GitHub

Nuestras conclusiones

Habiendo revisando los datos y sus principales alcances, resaltamos el esfuerzo del organismo emisor por entregar una base de datos detallada, interesante para comenzar proyectos de visualización y análisis de datos con cartografía de alto nivel y un nivel de correspondencia de datos cercana al 100% (no exacta ya que encontramos una manzana sin correspondencia con la base de datos manzana/entidad, les soplamos el dato Código: 7401072047112 por si alguien lo quiere revisar).

Si bien existen algunos alcances conversados que si requirieron algo de trabajo manejar para hacer una base de datos única, no se requiere de grandes esfuerzos para disponer de una Base de Datos censal que responda necesidades de análisis mayor, un buen trabajo y que esperamos permita generar un estándar comparable en el tiempo, en especial para los especialistas que realizan estudios de variación intercensal.

Hace mucho tiempo que no publicamos pero esperamos retomarlo a futuro con nuevas reseñas y agregando nuevos datos además de actualizar algunas capas que sabemos son de interés de la comunidad, hasta entonces seguiremos revisando. Les dejamos una galería con algunas imágenes de como nosotros trabajamos los datos del censo y esperamos entregar material interactivo como ideas para usar estos datos.

Hasta la proxima!

GEOMETADATOS, 2018

Altos Ingresos pero poco Interés en los datos de Chile

Una crítica reflexión y muchos puntos a considerar son las lecciones a rescatar para Chile en el marco del Reporte Regional del Barómetro de Datos Abiertos de la World Wide Web Foundation y que me gustaría resumir con el propósito de resaltar el valor de un producto tan fundamental para los tiempos modernos como lo son los datos.

Continúa leyendo Altos Ingresos pero poco Interés en los datos de Chile

80 días de Geometadatos

Ya han pasado 80 dias, según Julio Verne sería suficiente tiempo para dar una vuelta al mundo, pero en esta ocasión es para agradecer por todo el apoyo que se ha recibido por parte de ustedes. En tan solo 80 días este sitio ha ido paulatinamente creciendo y ganando influencia como un espacio para encontrar información espacial y mapas que muestran diversos aspectos y dimensiones del espacio geográfico. Ha ido de a poco escalando, paso a paso y queremos compartir contigo el crecimiento del blog y comentar algunas novedades que se aproximan para los próximos 80 días.

Continúa leyendo 80 días de Geometadatos

Edición OpenDataDay: Datos Abiertos de Chile

Geometadatos-04

En Geometadatos, celebramos el Día Internacional de los Datos Abiertos y desde nuestra vision entendemos la necesidad creciente de la difusión de esta filosofía cuyo propósito es poner al alcance y uso de todas las personas los datos que día a dia se generan y forman parte de nuestras decisiones o para convertirlas en información y posteriormente conocimiento. Para ello desarrollamos en nuestra línea de especialidad una aplicación web de mapas con el estado de los datos abiertos de Chile.

Continúa leyendo Edición OpenDataDay: Datos Abiertos de Chile

Nuestras Apps: Casinos en Chile

Geometadatos-02¿Te gusta apostar a ganador? Revisamos en Geometadatos la multimillonaria industria del juego legalizado a través nuestra propia aplicación web. Utilizando datos de la Superintendencia de Casinos de Juego ponemos a disposición potentes cifras sobre el juego en Chile de forma interactiva para que puedan revisar los numeros de esta poderosa industria.

Continúa leyendo Nuestras Apps: Casinos en Chile