Soy Jesús Escudero, y si estás recibiendo este email es que alguien —espero que tú— se ha suscrito con tu correo electrónico a FILAS Y COLUMNAS, la newsletter sobre producción estadística y análisis de datos en España —aquí puedes leer el último artículo y la anterior celda—. Si lo que vas a leer te parece interesante, reenvía el email o compártelo en tus redes sociales. Y si todavía no te has suscrito, puedes hacerlo en el siguiente botón.
Sometimes there is a difference between transparency and openness. It is possible to have the facts visible, but in ways that obfuscate the truth
Este es el inicio de un artículo de Max Harlow en Financial Times sobre uno de los temas que da más quebraderos de cabeza a la hora de trabajar con datos: el formato. (La columna se puede leer abriendo el enlace a través de Twitter).
Harlow critica la forma en la que los diputados británicos publican información de sus segundos trabajos a través de cientos de documentos y/o en texto narrativo en vez de en una tabla de datos, lo que impide su correcto escrutinio.
The information is published and accessible. But using that information is too time-consuming. The result? Less accountability and less scrutiny than if it were collected and presented in a modern, structured format
El periodista ha acuñado un concepto para este tipo de información que requiere un gran esfuerzo posterior de transformación para que sea útil y utilizable: pseudo-transparencia. Una forma —errónea— de entender los datos que aparece frecuentemente en esta newsletter. Y que, lamentablemente, seguirá apareciendo.
Empieza, ahora sí, la vigésima tercera celda de FILAS Y COLUMNAS.
Many data visualization problems are really data questions problems and there’s no amount of “graphical massaging” that is going to solve them if the questions are not well defined
Enrico Bertini, Asking the right data questions and asking the data questions right, FILWD, 2021-12-27
Declive de las ciudades europeas. En la pasada edición de FILAS Y COLUMNAS hacía mención a un estudio de Miguel González-Leonardo sobre el Declive demográfico y envejecimiento en las capitales de provincia. Esta misma semana la Comisión Europea publicaba un estudio que ampliaba este enfoque a todas las áreas urbanas de la Unión Europea con el inquietante título de Shrinking Cities (Ciudades cada vez más pequeñas). El informe final de ocho páginas —que se puede descargar directamente en este enlace— pone de manifiesto que España es uno de los países europeos más afectados por este fenómeno, junto a países del Este como Polonia, Hungría, Bulgaria y los países bálticos, tal y como se puede apreciar en el siguiente mapa. Como afirman los autores:
In fact, shrinking may well become the new normal for many cities and the populations that inhabit them. Shrinking is a complex process that affects multiple aspects from the physical structure of the city to its social and demographic fabric
Reparto de impuestos y prestaciones. El Observatorio sobre el reparto de los impuestos y las prestaciones entre los hogares españoles de Fedea ha publicado su sexto informe relativo a los años 2017 y 2018. A lo largo de 59 páginas, los autores del estudio —Julio López Laborda, Carmen Marín González y Jorge Onrubia— estiman “el impacto distributivo sobre los hogares residentes en España de las prestaciones públicas, monetarias y en especie, y del sistema fiscal para los años 2017 y 2018, presentándose resultados a nivel nacional y desagregados por comunidades autónomas”. Los investigadores concluyen, como se observa en el siguiente gráfico, que “el sistema de impuestos y prestaciones en España agota su progresividad en la parte más alta de la distribución de la renta bruta”. [visto a Lucía Gorjón]
Microdatos de las encuestas de El País. En un ejercicio de transparencia, El País ha comenzado a publicar los microdatos de sus encuestas elaboradas por la empresa 40dB. La información se puede descargar a través de este enlace y contiene los microdatos en cuatro formatos diferentes —csv, xlsx, dta y sav—, acompañado del cuestionario y la nota metodológica. Para cada encuestado —representado en cada una de las 2.000 filas— figura su información sociodemográfica, sus respuestas a cada pregunta y la ponderación asignada por 40dB. El archivo comprimido también contiene otro archivo Excel sobre el análisis de cruces e indecisos y una presentación de los resultados, que también se puede consultar en este enlace.
Sueldos de los directivos de RTVE. Tras más de un año de espera y gracias a una victoria ante la Justicia, Maldita.es ha tenido acceso mediante la Ley de Transparencia a las retribuciones anuales de los altos cargos y directivos de RTVE entre 2016 y 2020. La corporación pública ha desembolsado cada año más de 14 millones de euros en este concepto, una cifra que ha permanecido estable en este período. Los cargos con el sueldo más elevado son el de presidente —o administradora única tras la designación de Rosa María Mateo— y el de director general corporativo. Los últimos salarios, correspondientes al ejercicio 2020, se detallan en el siguiente gráfico. Todos los datos se pueden consultar y descargar en esta hoja de Google Sheets, incluyendo el sexo de los directivos —dos de cada tres son hombres—.
Bonus track internacional. Más de 1.700 congresistas de Estados Unidos esclavizaron a alguna persona negra. Este es el titular de una investigación publicada por el Washington Post a partir de la creación de una base de datos propia de los congresistas y senadores de Estados Unidos nacidos antes de 1840 y su cruce con los censos digitalizados de los siglos XVIII y XIX, donde se registraban los esclavos que tenía cada terrateniente —con nombres y apellidos (los terratenientes, no los esclavos)—. La reportera que lideró la investigación, Julie Zauzmer Weil, explicó más detalles del proceso en este Pregunta-Respuesta con los lectores del Washington Post. Los datos están disponibles en este repositorio de GitHub. [visto a Adrián Blanco]