2022-05-13: celda número 30
De centros de datos, pobreza, nacimientos, mujeres y datos incompletos
Soy Jesús Escudero, y si estás recibiendo este email es que alguien —espero que tú— se ha suscrito con tu correo electrónico a FILAS Y COLUMNAS, la newsletter sobre producción estadística y análisis de datos en España —aquí puedes leer el último artículo y la anterior celda—. Si lo que vas a leer te parece interesante, reenvía el email o compártelo en tus redes sociales. Y si todavía no te has suscrito, puedes hacerlo en el siguiente botón.
En las últimas semanas la revista Nature ha publicado sendos artículos sobre las lecciones (que deberían haber sido) aprendidas tras dos años de gestión de datos del coronavirus, algo de lo que se ha hablado largo y tendido durante este tiempo: en julio de 2020 María Zuil y yo publicamos un reportaje al respecto en El Confidencial.
Edouard Mathieu, jefe de datos de Our World in Data, aboga en el primer artículo por continuar actualizando los datos de la pandemia hasta que la Organización Mundial de la Salud (OMS) la declare finalizada. Destaco especialmente el siguiente párrafo:
Over and over, I’ve seen governments emphasize making dashboards look good when the priority should be making data available. A simple text file would do. After all, research groups like mine and citizens with expertise in data-visualization tools are more than willing to create a useful website or mobile app. But to do so, we need the raw material in a machine-readable format.
Esta reflexión coincide con lo expresado por los expertos de datos consultados en el segundo reportaje, titulado Lessons from the COVID data wizards. Consideran que el interés social hacia los datos y los gráficos suscitado a raíz de la pandemia debería ser razón más que suficiente para mejorar la recopilación, estandarización, acceso y disponibilidad de estadísticas públicas. Pero se hacen una pregunta: ¿Los políticos están dispuestos a mejorar estos procesos?
Empieza, ahora sí, la trigésima celda de FILAS Y COLUMNAS.
Sesgo de selección
Centros de datos en Europa. José Luis Marín, de El Orden Mundial, ha analizado para European Data Journalism Network la presencia de centros de datos en los países europeos. Estas infraestructuras básicas para el buen funcionamiento de internet es el último gran negocio del sector tecnológico que amenaza la sostenibilidad energética debido a su elevado consumo energético. Europa ya cuenta con casi 2.600 centros de datos, de los que el 70% se ubica en cuatro países: Alemania, Reino Unido, Países Bajos y Francia. España ocupa la séptima posición en esta clasificación, con 123 centros de datos, tal y como se aprecia en el siguiente gráfico de columnas, de los que 55 se encuentran en la Comunidad de Madrid.
Precariedad laboral y pobreza. ”En España, el 70% de niños en pobreza viven en hogares con uno o más trabajadores; y pese a que solo en un 27% de los hogares en España hay menores, los hogares con menores constituyen la mayoría de hogares en pobreza laboral (53%)”. Así empiezan Alba Lanau y Mariona Lozano, investigadoras del Centre d’Estudis Demogràfics en la Universidad Autónoma de Barcelona, su estudio sobre El peso de la precariedad laboral en la pobreza de los hogares con menores. Basada en datos longitudinales de la Encuesta de Condiciones de Vida 2017-2020, la investigación concluye que “los cambios en la situación laboral son más relevantes que los cambios en la composición del hogar para entender la pobreza laboral e infantil”, como muestra el siguiente gráfico de barras. [visto a Raül Segarra]
Impacto del covid-19 en los nacimientos. Los investigadores Marco Cozzani, Peter Fallesen, Giampiero Passaretta, Juho Härkönen y Fabrizio Bernardi han analizado Las consecuencias de la pandemia del covid-19 en la fertilidad y nacimientos en España a partir del registro de partos. El estudio de 35 páginas —descargable en este enlace— concluye que la caída de la fertilidad a finales de 2020, nueve meses después del inicio de la pandemia, afectó en un primer momento a las mujeres al principio y final de su etapa reproductiva, lo que los investigadores achacan al descenso de los embarazos no deseados y al cierre de las clínicas de reproducción asistida, respectivamente. Ambas situaciones contribuyeron a “una ola de ‘bebés perdidos’ con mayor riesgo de fragilidad”, ya que estos dos tipos de embarazos suelen finalizar antes de tiempo, lo que aumenta el riesgo tanto para la madre como para el bebé.
Razón de feminidad por municipios. Carlos Muñoz Díaz ha publicado un artículo en Apuntes de Demografía en el que analiza los datos más recientes de distribución por sexo en los más de 8.100 municipios españoles. El título del artículo, Las mujeres ya no pasean por el campo español, resume la brecha por hábitat que existe en nuestro país en cuanto a la presencia de mujeres. Como expone el autor, “el eje principal de las diferencias está entre lo rural y lo urbano: mientras que en el 84,6% de estos pueblos con menos de 2.000 habitantes hay menos mujeres que hombres, ninguna ciudad con más de 100.000 empadronados —en total, 63 municipios— cuenta con menos presencia de mujeres que de hombres”. El siguiente mapa evidencia estas diferencias de manera visual.
Bonus track internacional. Qué hacer con los registros nulos o sin información es uno de los retos más comunes de los que trabajamos con datos y estadísticas. En las últimas semanas se han publicado dos papers que analizan este fenómeno. El primero se titula Missing inaction: the dangers of ignoring missing data y concluye que la eliminación de datos incompletos incrementa el sesgo de estimación. El segundo estudio, 'I think I discovered a military base in the middle of the ocean' -- Null Island, the most real of fictional places, aborda la Null Island, un lugar ficticio en la intersección del ecuador y el meridiano de Greenwich (coordenadas 0º 0º) donde sólo hay una boya marítima y al que suele ir a parar la información geográfica sin coordenadas válidas, lo que tiene varias implicaciones en el análisis de datos. Un artículo de Bloomberg recoge lo más interesante del estudio y también muestra otros casos, como el de la ciudad de Lebanon (Kansas), el centro geográfico de Estados Unidos, donde la Universidad Johns Hopkins ubicó en su panel de datos del covid-19 los casos positivos del crucero Diamond Princess, atracado en Japón.