2022-06-17: celda número 32
De demografía, fútbol, ascensor social, prisión provisional y lactancia materna
Soy Jesús Escudero, y si estás recibiendo este email es que alguien —espero que tú— se ha suscrito con tu correo electrónico a FILAS Y COLUMNAS, la newsletter sobre producción estadística y análisis de datos en España —aquí puedes leer el último artículo y la anterior celda—. Si lo que vas a leer te parece interesante, reenvía el email o compártelo en tus redes sociales. Y si todavía no te has suscrito, puedes hacerlo en el siguiente botón.
¿Cómo organizar un proyecto de análisis de datos? Esta es la pregunta a la que ha respondido Carlos J. Gil Bellosta en su blog Datanalytics. Aunque “cada maestrillo tiene su librillo”, como el propio Gil Bellosta dice en su post, lo cierto es que la organización de estos proyectos sigue varios principios básicos: cada proyecto necesita un directorio propio, este directorio contiene varias carpetas para cada fase o elemento del proyecto, los nombres de los archivos no deben tener espacios —ni minúsculas ni tildes, añado—…
La estructura de directorios y carpetas que propone Gil Bellosta es bastante similar a la que los periodistas alemanes Marcel Pauly y Patrick Stotz explicaron en la Global Investigative Journalism Conference 2019 —aquí se puede acceder a las diapositivas de la presentación—. En ambos casos, hay unas pocas carpetas fijas, destacando especialmente dos: datos brutos o raw data, donde se guardan los ficheros originales y, como subraya Gil Bellosta, “no se modifican bajo ningún concepto y solo se tocan para ser leídos”; y datos procesados o staging, processed o tidy data, donde se guardan los datos limpios.
Ambos ejemplos ponen de manifiesto que una buena organización es el elemento básico para minimizar posibles errores en fases posteriores del análisis de datos.
Empieza, ahora sí, la trigésima segunda celda de FILAS Y COLUMNAS.
Data Analyst vs. Data Scientist
European Demographic Datasheet 2022. El Instituto de Demografía de Viena (VID) ha actualizado su European Demographic Datasheet con los datos correspondientes al pasado año. La recopilación estadística recoge 26 indicadores demográficos para 45 países europeos, Estados Unidos y Japón sobre población, proyecciones, fertilidad, mortalidad, COVID y capital humano. Un póster recoge todos estos indicadores, mientras que un documento de 12 páginas sintetiza las principales tendencias demográficas de los últimos años en Europa.
Inversión extranjera en el fútbol europeo. Álvaro Merino ha publicado en El Orden Mundial un análisis sobre la inversión extranjera en las grandes ligas —España, Inglaterra, Italia y Francia— del fútbol europeo. A diferencia de lo que uno puede pensar debido a la amplia cobertura mediática, no son los países del Golfo Pérsico los que más presencia tienen en los grandes equipos europeos sino Estados Unidos: “casi una quinta parte de los clubes de primera y segunda división de Inglaterra, España, Francia, Italia y Alemania tienen inversores estadounidenses”. Estas inversiones extranjeras evidencian “dos tendencias que están transformando los despachos del fútbol europeo: por un lado, el creciente interés de los inversores extranjeros, especialmente de los estadounidenses, en el deporte rey del Viejo Continente y, por otro, la viabilidad del fútbol como campo de inversión y especulación, cuando no de influencia política”. [visto a Javier García]
Movilidad intergeneracional de la renta. El investigador Javier Soria Espín es el autor de un policy brief publicado en EsadeEcPol titulado El ascensor social en España: un análisis sobre la movilidad intergeneracional de la renta —el informe completo se puede descargar en este enlace—. A partir de los microdatos del Atlas de Oportunidades, el estudio se fija en la movilidad de renta de los niños españoles que alcanzan la edad adulta (entre 30 y 36 años) en 2016, concluyendo que “el ascensor social español se sitúa en un punto intermedio entre los países de alta movilidad intergeneracional, como Australia o Suiza, y los de baja movilidad, como Estados Unidos o Italia”. Entre las principales aportaciones del informe está la de que “la migración interna favorece la movilidad intergeneracional”, sobre todo en “los hijos de familias con menos ingresos, [que son] los que más se benefician de la migración interna”, tal y como se muestra en el siguiente gráfico.
Prisión provisional. La Fundación Civio ha dedicado una serie de tres reportajes a la prisión provisional en Europa. De acuerdo a los datos recopilados junto al consorcio European Data Journalism Network (EdjNet), uno de cada cinco presos (casi 100.000 personas) en cárceles europeas no tiene condena firme, un porcentaje que en España se sitúa en el 15% de la población reclusa. Este colectivo se caracteriza especialmente por dos circunstancias: casi la mitad de los preventivos son extranjeros y tienen una mayor probabilidad de suicidio, “23 veces más alta que la de la población general y 1,58 veces mayor que la de los presos condenados”. Los datos en los que se basa la investigación están disponibles para su descarga en formato abierto en este enlace.
Bonus track internacional. Alyssa Rosenberg, columnista del Washington Post, dedicó la mayor parte de los seis primeros meses de su segundo hijo a dos tareas: darle el pecho y registrarlo en una aplicación. Con estos datos publicó un artículo interactivo en el que detalla las 1.700 tomas de leche durante este tiempo y el coste que le supuso, tanto en tiempo como en dinero. En total, Rosenberg dedicó un total de casi 500 horas —2 horas y 40 minutos de media diaria, con un máximo de 5 horas y 18 minutos al cuarto día— a alimentar a su hijo, con un coste de casi 1.400 dólares en ropa y material para extraer la leche materna. Como dice la columnista: “No es ninguna exageración decir que dar el pecho a un recién nacido es un trabajo a jornada completa, sobre todo al principio”.