2022-04-29: celda número 29
De R, calidad del trabajo, granjas de cerdos, barrio de Salamanca y sociedad post-covid
Soy Jesús Escudero, y si estás recibiendo este email es que alguien —espero que tú— se ha suscrito con tu correo electrónico a FILAS Y COLUMNAS, la newsletter sobre producción estadística y análisis de datos en España —aquí puedes leer el último artículo y la anterior celda—. Si lo que vas a leer te parece interesante, reenvía el email o compártelo en tus redes sociales. Y si todavía no te has suscrito, puedes hacerlo en el siguiente botón.
Uno de los conflictos eternos en materia de estadística es el que enfrenta a la publicación de microdatos con la protección de la privacidad de las personas. A la hora de salvaguardar ambos derechos se utilizan varias técnicas que van desde la agregación de datos a un nivel superior hasta la introducción de una cierta dosis de ruido estadístico para evitar la identificación de personas.
Esta última técnica es la que se ha empleado en el censo 2020 de Estados Unidos, pero dando lugar a algunos resultados curiosos. Como detalla un reportaje reciente del New York Times, este ruido ha localizado a 14 personas viviendo bajo el agua en pleno río Chicago o a 86 personas viviendo en una única casa en una sección censal.
La introducción de este ruido estadístico ha provocado un arduo debate entre los defensores de ambas posturas. El reportero del diario estadounidense, Michael Wines, lo resume de la siguiente forma:
To the career data nerds who are the census’s stewards, uncertainty is a statistical fact of life. To their customers, the images of census blocks with houses but no people, people but no houses, and even people living underwater have proved indelible, as if the curtain had been pulled back on a demographic Great Oz.
Este conflicto entre microdatos y privacidad se abordó de manera detallada en las jornadas del censo 2021 organizadas a principios de mes por el INE, el Departamento de Población del CSIC y la Asociación de Demografía Histórica (ADEH). El INE descartó la introducción de ruido estadístico en los resultados censales que se empezarán a conocer a finales de año, pero sí comentó otras técnicas de agregación y exclusión para proteger la privacidad de las personas.
¿Alguna vez se encontrará la fórmula óptima que satisfaga a todos los usuarios?
Empieza, ahora sí, la vigésima novena celda de FILAS Y COLUMNAS.
A viewer’s visual system can extract broad statistics about the data within a display, such as the mean and extrema, within a fraction of a second. Visualize your data with histograms and scatterplots before trusting statistical summaries
The Science of Visual Data Communication: What Works, Psychological Science in the Public Interest 2021, Vol. 22(3) 110–161
Curso de R. Javier Álvarez Liébana —@DadosdeLaplace en Twitter— ha liberado los materiales del curso de la Escuela de Invierno de la Universidad Complutense titulado Analizando datos, visualizando información, contando historias enfocado al manejo del lenguaje de programación R. Los documentos compartidos son el manual del curso, las diapositivas y los scripts, todo ello publicado en un repositorio abierto en GitHub. Tras una breve introducción a R, el curso se centra en tres librerías básicas para el análisis de datos: tidyverse (importación, limpieza y análisis), ggplot2 (visualización) y R Markdown (comunicación y reproductibilidad). [visto a Javier Álvarez Liébana]
Calidad y condiciones laborales en Catalunya. El Departament d’Empresa i Treball de la Generalitat de Catalunya ha publicado los resultados de su Encuesta sobre la calidad y las condiciones del trabajo 2021. Siguiendo la metodología de Eurofound y a través de un cuestionario de 130 preguntas dirigido a 3.000 personas, el estudio analiza la situación laboral de los ocupados así como “las condiciones ambientales, ergonómicas, de seguridad y psicosociales que pueden afectar a su salud”. Los principales resultados se han publicado en un documento PDF de 181 páginas. Además, tanto los datos tabulados en Excel como los microdatos en CSV y SPSS están disponibles para su descarga en este enlace. [visto a Raül Segarra]
Granjas de cerdos en Aragón. Maldito Clima, el nuevo espacio de Maldita.es, ha analizado el registro ganadero de Aragón y se ha encontrado con un dato sorprendente: 774 de las 4.295 granjas de cerdos que hay en la región (18% del total) tienen 1.999 o 2.000 cerdos. El motivo de esta acumulación no es otro que la obligatoriedad de emitir una declaración de impacto ambiental para las granjas que tengan más de 2.000 cerdos. Este trámite implica la elaboración de un estudio por parte de la empresa y la apertura de un plazo de alegaciones ciudadanas, todo lo cual retrasa el procedimiento administrativo. Un ejemplo más de cómo establecer una política en torno a una cifra concreta actúa de incentivo para apurar los límites legales.
Barrio de Salamanca. Un equipo de seis periodistas de El Confidencial —Elena Sanz, Darío Ojeda, Rocío Márquez, Laura Martín, Luis Rodríguez y Fernando Anido— han producido un reportaje visual sobre el madrileño barrio de Salamanca, “en el que los ricos siempre han querido vivir”. La pieza, que combina texto, imágenes, gráficos y mapas interactivos así como fuentes documentales históricas y datos estadísticos recientes, se divide en ocho bloques en los que se narra desde el origen del barrio a finales del siglo XIX gracias “a dos figuras: Carlos María de Castro, uno de los grandes urbanistas madrileños y artífice del ensanche de Madrid, y José María de Salamanca y Mayol, Marqués de Salamanca, uno de los grandes terratenientes del ensanche Este”, hasta la llegada en los últimos años de emigrantes sudamericanos, especialmente venezolanos.
Bonus track internacional. ¿Cómo ha cambiado la vida de los británicos como consecuencia de la pandemia del covid-19? Esta es la pregunta a la que intenta responder un reportaje multimedia publicado por The Guardian en el que se analiza los cambios sociales durante los dos últimos años. Un equipo multidisciplinar de siete periodistas se ha encargado de bucear en las estadísticas públicas para mostrar los cambios sufridos en ocho ámbitos de la vida pública en Reino Unido: teletrabajo, migraciones de la ciudad al campo, ahorro de las familias, viajes al extranjero, hábitos de compra, ocio en casa, videollamadas y perspectiva de futuro. A tenor de los datos, la ‘nueva normalidad’ es más bien una diferente realidad.