2022-04-08: celda número 28
De demografía longitudinal, universitarios, bebidas azucaradas, aviones y censo
Soy Jesús Escudero, y si estás recibiendo este email es que alguien —espero que tú— se ha suscrito con tu correo electrónico a FILAS Y COLUMNAS, la newsletter sobre producción estadística y análisis de datos en España —aquí puedes leer el último artículo y la anterior celda—. Si lo que vas a leer te parece interesante, reenvía el email o compártelo en tus redes sociales. Y si todavía no te has suscrito, puedes hacerlo en el siguiente botón.
Hace unos días, Carlos Gil Bellosta tuiteó un artículo con un titular muy llamativo.
La autora, Natassha Selvaraj, identificaba dos razones principales que explicarían por qué los científicos de datos dejan sus trabajos. La que más me interesa es la primera, que Selvaraj expresa de la siguiente forma:
You’re excited to finally start working on real-world machine learning problems, and put all the skills you’ve acquired over the years in practice. However, on your first day at the job, you realize that the company has massive amounts of unstructured data entering the system that hasn’t been formatted or processed in any way.
Your employer sees you as the go to “data guy,” and puts you in charge of helping him increase sales with the help of large amounts of data they’re collecting everyday.
At the end of the day, you’re no longer building complex algorithms and predictive models like you imagined. You now spend all your time brushing up on SQL and data preparation skills to pull data out of the system into different formats, and present this data to stakeholders so they can use it to make business decisions.
Estamos nuevamente ante un problema que ya he tratado aquí en muchas ocasiones: el desdén hacia la parte más fundamental de la investigación basada en datos y estadísticas —la definición, recopilación y homogeneización de la información— y el énfasis en la fase que menos tiempo lleva pero donde uno puede lucirse más —el análisis, la visualización o el diseño de algoritmos—.
Y luego está el problema de los cargos y las competencias. Tenemos ingenieros, analistas, científicos y visualizadores de datos. Pero hasta lo que yo sé —siempre puedo estar equivocado—, ninguno de estos perfiles tiene encomendada la recopilación y limpieza de los datos, y el trabajo de captador o limpiador de datos no existe.
¿Quién se encarga entonces de la parte más importante del proceso, la de garantizar la calidad del dato?
Empieza, ahora sí, la vigésima octava celda de FILAS Y COLUMNAS.
Formar un equipo de datos en 2021
Análisis longitudinales en demografía. La Revista Española de Sociología ha publicado su último número en el que se encuadra una sección monográfica sobre demografía centrada en análisis longitudinales, un tipo de investigación basado en el seguimiento de un fenómeno o una población a lo largo de un periodo de tiempo. Estos son los seis artículos que forman parte de esta sección.
Generaciones y curso(s) de vida: una mirada longitudinal a los
Cambios generacionales del gradiente socioeconómico de la
formación de la primera unión en España (artículo en inglés)
De las disfunciones a los problemas sexuales en la vejez: el
El futuro del colectivo universitario. Lucía Gorjón, Ainhoa Osés y Sara de la Rica, de la Fundación ISEAK, han publicado un informe de 94 páginas sobre El futuro del colectivo universitario: calidad del empleo y competencias en el que analizan “la preocupante proporción de empleo desencajado (no acorde al contenido de los estudios) de las personas universitarias”. Este empleo desencajado es mayor en las ramas de Artes y humanidades y Ciencias, donde el 28,3% y el 23% de personas, respectivamente, tiene un puesto de trabajo no acorde a sus estudios. Además, las investigadoras abordan las diferencias del mercado laboral de 1997 y de 2019 para hallar las profesiones científicas e intelectuales que más han aumentado en estos años. No sorprende a nadie que las ocupaciones con mayor aumento hayan sido matemáticos y estadísticos, cuyo peso se ha multiplicado por 11 respecto a 1997, y los especialistas en finanzas, que se han multiplicado por cinco. Por último, las autoras también analizan las profesiones cuyo empleo está en declive y el caso específico de Andalucía. Un informe muy interesante del que se ha publicado un artículo resumen en Nada es Gratis. [visto a Lucía Gorjón]
Impuestos a las bebidas azucaradas. Carlos Fernández Escobar y Miguel Ángel Royo Bordonada han encabezado dos estudios científicos recientes sobre los impuestos a las bebidas azucaradas. El primero —que también ha contado con la participación de Carlos Gil Bellosta y Elena Ordaz— analiza el Efecto del impuesto en las bebidas azucaradas en Cataluña tres años y medios después de su introducción. Las conclusiones apuntan a que el aumento del precio del 11% tuvo como efecto una reducción del consumo en un 18%, si bien el consumo de las bebidas light y zero se incrementó en un 22%. En paralelo, los dos investigadores junto a Sara Fernández Sánchez-Escalonilla hicieron una encuesta a un millar de personas para comprobar la popularidad de esta medida. En total, dos de cada tres encuestados se mostraban favorables a este impuesto, siendo este porcentaje más elevado entre las personas de izquierdas (77%), los bebedores ocasionales (72%) y las personas con ingresos más altos (72%). El estudio completo está disponible en este enlace. [visto a Carlos Fernández]
El nuevo mapa aéreo europeo. Javier G. Fernández y Artur Zanón han analizado en Expansión cómo el cierre del espacio aéreo ruso ha obligado a las aerolíneas a rediseñar los recorridos de sus vuelos hacia Asia. Estas nuevas trayectorias han aumentado el tiempo y kilómetros de vuelo, lo que a su vez repercute negativamente en las cuentas económicas de las aerolíneas debido al mayor consumo de combustible —lo que provoca a su vez mayores emisiones a la atmósfera— en unos meses marcados por los elevados precios del gas y petróleo. No es el único reportaje basado en el seguimiento de vuelos que se ha publicado recientemente. Bloomberg ha traqueado las rutas de los aviones privados por Europa para poner de manifiesto que las emisiones a la atmósfera están influenciadas por el nivel de ingresos, debido sobre todo a un mayor uso del transporte privado por parte de las élites económicas.
Bonus track internacional. Los Archivos Nacionales de Estados Unidos han desvelado recientemente los secretos más íntimos del censo de 1950. Expirado el embargo de 72 años que la ley establece para las encuestas censales, la oficina gubernamental estadounidense ha publicado en abierto más de 6,57 millones de tablas censales con los datos personales de los 150,7 millones de personas que vivían en 1950 en Estados Unidos. Los archivos digitalizados se encuentran en esta página web, que permite la búsqueda de las tablas referidas a cada núcleo residencial y en el que se pide la ayuda de los usuarios para transcribir y verificar la información digitalizada. Además, en esta otra página web figuran los principales datos estadísticos obtenidos del censo de 1950. Como aseguró el director de la National Genealogical Society en el reportaje del New York Times sobre la publicación censal, “es como combinar la Super Bowl y los Juegos Olímpicos, y sólo ocurre cada diez años“.