2022-02-18: celda número 25
De energía, sociología, mercado laboral, prostitución y precios
Soy Jesús Escudero, y si estás recibiendo este email es que alguien —espero que tú— se ha suscrito con tu correo electrónico a FILAS Y COLUMNAS, la newsletter sobre producción estadística y análisis de datos en España —aquí puedes leer el último artículo y la anterior celda—. Si lo que vas a leer te parece interesante, reenvía el email o compártelo en tus redes sociales. Y si todavía no te has suscrito, puedes hacerlo en el siguiente botón.
Casi un mes llevaba en mi barra de marcadores el siguiente artículo: Overdebunked! Six Statistical Critiques That Don’t Quite Work. El autor de la publicación, Nick Huntington-Klein, desmonta seis críticas habituales sobre varias cuestiones estadísticas. Más allá del listado en sí, el artículo tiene varios recordatorios sobre aspectos de los datos que solemos olvidar, como lo difícil y caro que resulta recopilar y acceder a los datos: cuanto más detalle, más recursos se necesitan.
Pero el recordatorio más importante que Huntington-Klein pone sobre la mesa es el de la imperfección de la estadística y el análisis de datos:
Statistical analysis is always imperfect and incomplete and, to some degree, wrong. Doing analysis requires making assumptions about where the data came from and how it fits together with the real world.
O dicho de una forma más elegante:
Statistical analysis is about getting close enough to the truth to be useful, not actually true, and getting results that are consistent enough to point in the right direction, not always the same every time.
Igual que las encuestas electorales se presentan con un margen de error —unas más que otras—, las estadísticas y los datasets también lo tienen aunque no se refleje. En el margen de error estadístico cobra mayor importancia otros elementos como la forma de recoger la información, las definiciones de las variables, los sesgos o el volumen de información. Pero imperfecciones estadísticas, haberlas haylas. Siempre.
Empieza, ahora sí, la vigésima quinta celda de FILAS Y COLUMNAS.
Anotaciones sobre el trabajo con datos
Consumo energético en los edificios de Europa. La European Climate Foundation ha promovido un panel interactivo que recoge varios indicadores sobre el consumo energético en los edificios de la Unión Europea. Desarrollado por Almut Bonhage y Maarten Lambrechts, el dashboard en forma de cartograma muestra la evolución de varias estadísticas energéticas —consumo por hogar, porcentaje de energías renovables en los hogares o la población que vive en malas condiciones y sin poder mantener la casa caliente— para cada uno de los 27 países europeos. Los indicadores nacionales se pueden ver en una página específica, como la referida a España que reproduzco a continuación. Todos los datos del panel se pueden descargar en Excel en este enlace. [En relación a estadísticas energéticas, Eurostat ha actualizado su catálogo de estadísticas relacionadas con la energía para adaptarlas al European Green Deal]
Revista Española de Investigaciones Sociológicas. Ocho artículos y cuatro críticas de libros componen el número 177 de la Revista Española de Investigaciones Sociológicas (REIS) editado por el Centro de Investigaciones Sociológicas (CIS). Las estadísticas y los datos vertebran toda la publicación, con un papel protagonista en los siguientes estudios:
Tiempo destinado a Internet por los adolescentes españoles, de Luis V. Casaló, José-Julián Escario y J. Ignacio Giménez Nadal.
Desigualdad de oportunidades educativas en España, de María Fernández-Mellizo.
Conciencia fiscal y presupuestos participativos, de Gloria Alarcón García, José Manuel Mayor Balsas y Claudia María Quintanilla Domínguez.
Evolución de la protesta en España (2000-2017), de Eduardo Romanos e Igor Sádaba.
Mercado laboral por ocupaciones en Catalunya. L’Observatori del Treball i Model Productiu de la Generalitat de Catalunya mantiene un panel interactivo con información laboral actualizada de más de 500 ocupaciones a cuatro dígitos, el mayor desglose posible de la Clasificación Nacional de Ocupaciones. La página web recoge datos sobre el número de contratos, personas contratadas, contratos indefinidos, duración mediana de los contratos temporales y demandantes de empleo. A partir de esta información, el observatorio elabora un índice sintético global para cada ocupación basado en tres variables: contratación, calidad y demandantes. El usuario puede comparar estos indicadores para dos ocupaciones mediante un gráfico de radar. [visto a Raül Segarra]
Anuncios de prostitución por sección censal. Jordi Pérez Colomé ha publicado en El País los principales datos de un informe sobre la prostitución en España [bajo suscripción] que saldrá a la luz en la primavera en formato digital y papel. El catedrático de Sociología de la Universidad de Valencia Antonio Ariño Villarroya y el científico de datos Rubén Rodríguez Casañ han recopilado y analizado cerca de medio millón de anuncios publicados en seis páginas web para detectar tendencias y patrones sobre la prostitución en España. Los dos investigadores han conseguido localizar en un mapa el número de anuncios por sección censal, además de otro tipo de información como los servicios, la distribución por sexo, las tarifas, los usuarios, los mensajes y los clicks —casi 18 millones en un mes en un único portal— de estas páginas web.
Bonus track internacional. La subida y bajada de los precios ha sido históricamente un magnífico indicador de la situación económica de un territorio. Recopilando y estructurando tablas con precios medievales, Vlad Zavidovych publicó hace ocho años un análisis sobre los precios y salarios en Inglaterra durante la Baja Edad Media entre los siglos XIII y XV. Entre los muchos datos que muestra el artículo, llama la atención la relativa estabilidad de los precios durante varias décadas, lo mucho que le gustaba beber a la gente de la época —un cuarto del gasto se iba en alcohol— y cómo la Peste Negra provocó una repentina devaluación salarial para una posterior fuerte subida debido a la escasez de mano de obra. Bastantes diferencias en comparación con la situación inflacionista actual. [Justo ayer el equipo editorial de Datawrapper publicó un post utilizando estos datos]