Soy Jesús Escudero, y si estás recibiendo este email es que alguien —espero que tú— se ha suscrito con tu correo electrónico a FILAS Y COLUMNAS, la newsletter sobre producción estadística y análisis de datos en España —aquí puedes leer la anterior celda—. Si lo que vas a leer te parece interesante, reenvía el email o compártelo en tus redes sociales. Y si todavía no te has suscrito, puedes hacerlo en el siguiente botón.
Hace diez días se anunció una noticia largamente esperada y deseada.
Lo que a priori es una excelente noticia para los amantes de los datos y la estadística, no lo es tanto si leemos la letra pequeña: las cuatro instituciones involucradas acordaron “comenzar a trabajar conjuntamente en el diseño de un sistema colaborativo de datos al que los investigadores tendrán acceso, siempre que la información vaya a ser utilizada con fines científicos de interés público”. Es decir, el acceso a estos microdatos estará restringido única y exclusivamente a investigadores, como hasta ahora —a modo de ejemplo, este es el formulario de solicitud de los microdatos de la Muestra Continua de Vidas Laborales—.
Esta política restrictiva, ampliamente instaurada en casi todas las instituciones nacionales e internacionales que manejan datos públicos, siempre me ha sorprendido. Para mal. No entiendo que las administraciones dejen fuera a una buena parte de la sociedad que puede hacer un buen uso de estos microdatos simplemente por no ser investigadores. En la época de los datos abiertos, muchos microdatos continúan cerrados.
En ‘Amplitud (Range): Por qué los generalistas triunfan en un mundo especializado’, su autor, David Epstein, dedica un capítulo a InnoCentive, una plataforma en la que administraciones, instituciones y empresas lanzan retos que sus expertos internos no han podido solucionar para que cualquiera pueda encontrar una solución. La NASA fue uno de los organismos que usó InnoCentive para lanzar un desafío: durante tres décadas no había encontrado la forma de predecir las tormentas de partículas solares. Un ingeniero retirado encontró la solución.
Epstein recoge esta frase de Vanevar Bush, exdecano del MIT: “El progreso científico, en amplia medida, resulta del juego libre de intelectos libres, trabajando en temas de su propia elección, en la forma que dicte su curiosidad para la exploración de lo desconocido”. Esto lo he visto en muchos hackatones y reportajes: la gran variedad de temas y enfoques que se pueden extraer de una misma base de datos. Al restringir el acceso a sus microdatos sólo para los investigadores, el INE, la Agencia Tributaria, el Banco de España y la Seguridad Social están perdiendo la oportunidad de que miles de amantes de los datos —analistas y científicos de datos, estadísticos, cartógrafos, periodistas, aficionados a los números, estudiantes, jubilados…— también puedan extraer conocimiento de esta información.
Empieza, ahora sí, la sexta celda de FILAS Y COLUMNAS.
Soy más un limpiador de datos que un analista de datos (Steven Rich, periodista de datos del Washington Post)
Sociología de los votos a los partidos políticos. El francés Amory Gethin, la española Clara Martínez-Toledano y Thomas Piketty son los editores del libro Political Cleavages and Social Inequalities. A Study of Fifty Democracies, 1948-2020, en el que intentan dar respuesta a una sencilla pregunta: ¿quién vota a quién y por qué? Además del libro en formato papel, los autores han desarrollado una herramienta interactiva que permite analizar la evolución del voto por partido político o año de elección cruzándolo con una serie de variables socioeconómicas, como sexo, edad, clase social, religiosidad o estado civil. Gethin, Martínez-Toledano, Piketty y su equipo de colaboradores han decidido publicar todos los gráficos y microdatos en los que basan su investigación.
Velocidad de internet (bis). Uno de los trabajos destacados en la anterior celda de FILAS Y COLUMNAS fue el que realizó el European Data Journalism Network (EDJNet) sobre la velocidad de internet en municipios y territorios europeos. La fuente original de los datos es Speedtest by Ookla, que ha compartido esta misma información a un mayor nivel de detalle, en cuadrículas de unos 600 metros de lado. Los archivos descargables están disponibles a través de AWS de Amazon o del GitHub de Ookla. Rob Fry, jefe de Visualización de Datos del INE británico —ONS por sus siglas en inglés— ha elaborado un mapa interactivo con la velocidad de internet en Reino Unido e Irlanda.
Retos demográficos. Ángeles Sánchez Díez, profesora de la Universidad Autónoma de Madrid, ha coordinado el libro Las transformaciones de la economía mundial —descargable en PDF en este enlace— del Grupo de Estudio de Transformaciones de la Economía Mundial. El libro, de más de 500 páginas, aborda las transformaciones de las últimas décadas que están dibujando el tipo de sociedad característico del siglo XXI. The Conversation ha publicado un extracto del capítulo dedicado a “los grandes retos demográficos del siglo XXI” del mundo global: urbanización y envejecimiento de la sociedad y migraciones internacionales. Destaco la siguiente frase del artículo:
Asia, el continente más poblado, registra un rápido proceso de envejecimiento. En 2020 el 56,7% de su población tenía más de 65 años, frente al 44% de 1990. Hay quien afirma que China será antes un país viejo que rico
Agua del grifo vs. agua embotellada. Los periodistas Antonio Villarreal y Darío Ojeda, de El Confidencial, expusieron recientemente otras ‘dos Españas’: la Occidental que bebe agua del grifo y la Oriental que prefiere agua embotellada. Son varias las razones que explican estos diferentes comportamientos, como las diferencias geológicas entre ambas zonas de España y, por consiguiente, el menor o mayor coste del tratamiento de las aguas o la dependencia del regadío para los cultivos. Los dos mapas que ilustran el reportaje —a nivel provincial y municipal— hablan por sí solos.
Bonus track internacional. Los próximos días 4 y 5 de mayo se celebra online la csv,conf,v6, “una conferencia comunitaria para creadores de datos de todo el mundo”. El programa está centrado en mostrar ejemplos sobre cómo mejorar la recopilación, la calidad y el análisis de los datos, así como aumentar el trabajo colaborativo entre equipos interdisciplinares. La entrada gratuita para la conferencia se puede obtener en Eventbrite.