2021-09-03: celda número 14
De inundaciones, áreas urbanas, cajeros, yihadistas y usos del suelo
Soy Jesús Escudero, y si estás recibiendo este email es que alguien —espero que tú— se ha suscrito con tu correo electrónico a FILAS Y COLUMNAS, la newsletter sobre producción estadística y análisis de datos en España —aquí puedes leer el último artículo y la anterior celda—. Si lo que vas a leer te parece interesante, reenvía el email o compártelo en tus redes sociales. Y si todavía no te has suscrito, puedes hacerlo en el siguiente botón.
Agosto terminó, FILAS Y COLUMNAS regresa.
En este mes de asueto se han publicado en Estados Unidos dos largos reportajes sobre el deficiente proceso de recopilación de los datos del COVID-19.
Una investigación de seis meses de POLITICO muestra los graves fallos de los sistemas estatales de salud pública a la hora de trazar, homogeneizar y recopilar los casos de coronavirus. Miles de positivos duplicados; formularios completados en papel y posteriormente digitalizados manualmente, con el consiguiente aumento de errores humanos; envíos de datos por fax o correo postal; ausencia de interoperabilidad entre los diferentes sistemas de información… Todos estos errores flagrantes en la recopilación y transmisión de los datos dificultó aún más la reacción sanitaria y política a las diferentes olas de la pandemia.
El segundo artículo, publicado en MIT Technology Review, hace hincapié en los numerosos y groseros errores de los diferentes modelos de inteligencia artificial que se desarrollaron para detectar la infección por SARS-CoV-2. La principal causa de estos errores no fue otra que “la mala calidad de los datos que los investigadores utilizaron para desarrollar sus herramientas”. El artículo deja caer un concepto que puede tener mucho recorrido: datos Frankestein, aquellos que “se combinan de varias fuentes y pueden contener duplicados”, además de tener “un origen poco claro”. La contundencia del reportaje se plasma en el titular: “Cientos de herramientas de inteligencia artificial se desarrollaron para detectar el coronavirus. Ninguna ayudó“.
‘Garbage in, garbage out’ es el aforismo por excelencia de la producción estadística y el análisis de datos. Resulta llamativo lo poco que se incide en la primera parte —la entrada de los datos— y el mucho peso que se da a la segunda —la salida de los datos—, pese a que el éxito de la segunda depende totalmente de la primera. Como si en un edificio se centraran los esfuerzos en la fachada y el diseño de los interiores dejando a un lado la estructura y las vigas que lo sostienen.
Empieza, ahora sí, la decimocuarta celda de FILAS Y COLUMNAS.
Técnicos de datos vs. entrevistadores de datos
Base de datos mundial de inundaciones. Una colaboración entre Cloud to Street y The Flood Observatory (DFO) ha dado lugar a la primera base de datos mundial de inundaciones: Global Flood Database. El proyecto ha recopilado las mayores inundaciones mundiales desde el año 2000 con información sobre la duración del evento y la causa de la inundación, así como la superficie y las personas afectadas. Hasta el momento, los investigadores han registrado 913 eventos en 169 países —once en España— que han afectado a más de 255 millones de personas en todo el mundo.
La base de datos ha sido portada del número 596 de Nature, publicado el pasado 5 de agosto —el artículo completo, previo pago, está disponible en este enlace—. Las fuentes y la base de datos creada por los investigadores están disponibles en formato abierto tanto en la página web como en los apéndices del artículo de Nature. Además, el proyecto cuenta con un repositorio en GitHub.
Población de las áreas urbanas. A partir de los microdatos del Padrón Continuo, Fernando Gil-Alonso, Cristina López-Villanueva, Jordi Bayona-i-Carrasco e Isabel Pujadas, investigadores de la Universidad de Barcelona y del Centre d’Estudis Demogràfics, han analizado la variación de la población de las 69 áreas urbanas españolas durante la segunda década del siglo XXI. La investigación también ha tenido en cuenta las dos fases de este periodo —la crisis económica (2011-2015) y la post-crisis (2015-2019)— y la evolución de la población tanto en los núcleos urbanos como en las periferias.
Como se puede observar en el gráfico inferior, la población en estos grandes núcleos urbanos aumentó de manera considerable a partir de 2015, sobre todo en la periferias. A partir de este cruce de datos, los autores establecen cuatro tipos de áreas urbanas:
26 ciudades menguantes que perdieron población en las dos fases, como fue el caso de Gijón, Cáceres, Pontevedra o Córdoba.
20 áreas urbanas dinámicas al haber ganado habitantes en las dos fases, como Albacete, Badajoz, Santiago de Compostela o Vitoria.
20 áreas urbanas en recuperación que han ganado población en la post-crisis tras perderla durante el período 2011-2015, como Madrid, Barcelona, Bilbao o Valencia.
3 ciudades en retroceso —Cartagena, Mérida y Jerez de la Frontera—, que tras ganar habitantes durante la primera fase los han perdido al terminar la década.
Cajeros automáticos. Diana Posada Restrepo, de la Dirección General de Efectivo y Sucursales del Banco de España, ha elaborado un informe sobre la Infraestructura del efectivo y vulnerabilidad en el acceso al efectivo en España en el que analiza la presencia o ausencia de cajeros automáticos en los más de 8.100 municipios españoles. Según sus cálculos, alrededor de 1,3 millones de personas —algo más que los habitantes de la provincia de Cádiz, la octava más poblada del país— “se encuentran en una situación que puede considerarse vulnerable” en relación al acceso al efectivo.
Las provincias con un menor porcentaje de población que vive a menos de 5 kilómetros de un cajero automático son Zamora y Ávila, seguidas del resto de provincias de Castilla y León. Según el índice de vulnerabilidad desarrollado por Diana Posada, León, Zamora y Salamanca “concentran la mayor parte de la población en municipios considerados de muy alta vulnerabilidad en el acceso al efectivo”, mientras que Ourense, Lugo y A Coruña es donde hay más localidades consideradas de vulnerabilidad media. Y un dato más: Cádiz es la única provincia en la que todos sus municipios (45) tienen al menos un cajero automático.
Yihadistas en España. Carola García-Calvo, Fernando Reinares y Álvaro Vicente, investigadores del Real Instituto Elcano, han publicado un estudio —accesible previo pago— en la revista científica Studies in Conflict & Terrorism sobre el origen de los yihadistas detenidos o fallecidos en España entre 2013 y 2018. Además de evidenciar el origen marroquí de la inmensa mayoría de estos yihadistas, algo lógico teniendo en cuenta la proximidad con España, la investigación destaca “el florecimiento del yihadismo doméstico en España (…), en gran parte como resultado de la radicalización de descendientes marroquíes o segundas generaciones”.
Bonus track internacional. En qué zonas de Estados Unidos se han concentrado los desarrollos urbanísticos en lo que llevamos de siglo. Esto es lo que ha plasmado el Washington Post en una serie de mapas que ilustran las nuevas construcciones artificiales desde el año 2001 a partir de datos satelitales de usos del suelo producidos por el U.S. Geological Survey. En algunas ciudades, como Houston o Texas, la mayoría de las nuevas construcciones en este tiempo tiene un uso residencial, mientras que en zonas de Dakota del Norte y Texas los nuevos desarrollos están relacionados con la explosión del fracking.