El Español
España en cifras
España

Acerca de España en cifras

España en cifras es un proyecto de periodismo de datos para comprender lo que ocurre en el país a través de sus indicadores. Los datos nos ayudan a conocer mejor la realidad y son el inicio de las historias y de las noticias. Por esta razón, hemos reunido en esta herramienta los principales indicadores demográficos, sociales y económicos que ayudan a comprender y explicar la realidad que nos rodea.

Detrás de esta tarea se esconde un arduo trabajo de recopilación de datos, así como su limpieza y estructuración para convertirlos en lo que se muestra ante sus pantallas.

Se han recogido datos municipales, provinciales y autonómicos. En el caso de los municipios, la desaparición y creación de los mismos, así como el cambio de nombre de algunos de ellos ha complicado en muchos casos la tarea de limpieza.

Los datos electorales presentados pretenden ofrecer un contexto histórico desde que se celebraran los primeros comicios electorales en el año 1979. Se han recopilado datos de los concejales obtenidos en cada legislatura por los partidos. Estas cifras ofrecen la evolución de cada municipio español. Estos datos han sido obtenidos a través de una petición de información enviada al Ministerio del Interior al estar recogidos y publicados únicamente el número de votos obtenidos por cada partido. Además, la herramienta también muestra el nombre de los alcaldes que gobiernan en la actualidad.

A nivel autonómico se ofrece el número de escaños obtenidos por cada partido en cada proceso electoral. Los datos se publican en el Congreso de los Diputados y permiten la descarga en formato reutilizable Excel. Pero debido al amplio número de comicios celebrados desde 1979 y a la cantidad de información, hemos seguido un proceso de automatización para la extracción de los datos. Su posterior limpieza y estructuración también ha conllevadoutilizar un proceso con herramientas de scraping, limpieza y análisis de los datos.

Los nombres de los presidentes autonómicos y el histórico de gobernación de los mismos se ha obtenido a través de un proceso de scraping puesto que esos datos estaban publicados en formato PDF y era difícil obtenerlos.

En cuanto al número de personas llamadas a votar y a los nuevos electores, se han consultado las cifras del Censo Electoral del INE.

Los datos de población se han extraído del Instituto Nacional de Estadística (INE). Para la cifra total de habitantes se han tenido en cuenta los datos de Cifras Oficiales de Población de los Municipios Españoles: Revisión del Padrón Municipal mientras que para el desglose de población por grupos de edad se han usado los datos englobados en la Estadística del Padrón Continuo al no figurar tal distinción en la anterior estadística.

En los datos de deuda pública por comunidades autónomas se ha utilizado como fuente principal el Banco de España. Esta fuente distingue, por un lado, los datos de deuda en relación con el porcentaje que supone del Producto Interior Bruto y, por otro, la deuda pública en números absolutos. Dado que varían según se considere uno u otro, se muestran ambos datos. Asimismo se ha querido mostrar cuál es la cifra de deuda que le corresponde a cada español, cifra que no es publicada por el Banco de España. Es cifra se ha calculado dividiendo la deuda total de cada comunidad entre supoblación.

Para la extracción de datos se ha utilizado la herramienta de scraping Kimono. Las tecnologías empleadas para el análisis y la limpieza de los datos han sido Excel y Open Refine. También se han utilizado diferentes herramientas para extraer tablas atrapadas en documentos PDF como Tabula.

Proyecto realizado para EL ESPAÑOL por Populate: