2022-02-04: celda número 24
De open data, España en cifras, desigualdad, oficinas bancarias y canciones
Soy Jesús Escudero, y si estás recibiendo este email es que alguien —espero que tú— se ha suscrito con tu correo electrónico a FILAS Y COLUMNAS, la newsletter sobre producción estadística y análisis de datos en España —aquí puedes leer el último artículo y la anterior celda—. Si lo que vas a leer te parece interesante, reenvía el email o compártelo en tus redes sociales. Y si todavía no te has suscrito, puedes hacerlo en el siguiente botón.
Aunque esta no es una newsletter centrada en las herramientas y el software para trabajar con datos, hay recursos que bien merecen una excepción.
Es el caso de la Library of Statistical Techniques (LOST), un repositorio abierto en GitHub ideado por Nick Huntington-Klein que recoge un amplio abanico de técnicas estadísticas —desde la limpieza de los datos hasta el machine learning pasando por la visualización y los modelos estadísticos— y el código necesario para ejecutar el proceso en R, Python, Julia, Stata y otros lenguajes de programación. Como afirman los autores del proyecto:
LOST is a Rosetta Stone for statistical software
Y si estas técnicas te suenan a chino, dejo un par de cursos online gratuitos para iniciarte en los dos principales lenguajes de programación orientados a la estadística, R y Python: R for Journalists, de Andrew Ba Tran, periodista de datos del Washington Post, y el curso de Python orientado al análisis de datos de Luz Frías, CTO de Circiter.
Empieza, ahora sí, la vigésima cuarta celda de FILAS Y COLUMNAS.
The decision to collect some set of data —or not to collect another— is the biggest one to make, and how data is collected and stored deeply affects the ways in which it might later be used to make choices, to tell stories, or to act on individuals and groups. Most important, each decision made at the moment of collection is amplified as data are computed upon, inflated by algorithms, and distilled by visualization
Jen Thorp, Living in Data, p.60
Open Data in Europe 2021. ¿Cuál es la situación de los datos abiertos en 34 países europeos? Esta es la pregunta a la que intenta responder Open Data in Europe 2021, un dashboard interactivo que recoge 16 indicadores relativos a las políticas, los portales, el impacto y calidad de los datos abiertos en estos países. España aparece como el segundo país con los resultados más altos, empatado con Irlanda y Polonia y sólo por detrás de Francia. Nuestro país tiene mejores resultados que la media europea en todos los indicadores salvo el de disponibilidad de datos en el portal web, tal y como figura en las dispositivas relativas a España. El informe completo también está disponible en formato PDF (103 páginas).
España en cifras 2021. El INE ha publicado España en cifras 2021, “una publicación que se caracteriza por su carácter divulgativo y su estilo directo y sencillo para explicar y exponer los fenómenos sociales, económicos y demográficos que suceden en nuestro país”. A lo largo de 68 páginas distribuidas en 21 apartados, el documento recoge varios indicadores y estadísticas que plasman diferentes realidades de nuestro país sobre la población, la economía, el medio ambiente, la seguridad o la justicia. De entre los muchos gráficos de la publicación, me ha llamado la atención el siguiente mapa que muestra el porcentaje de graduados que trabajan en la misma comunidad autónoma en la que estudiaron, donde se ve cómo Cataluña y País Vasco son las comunidades que más estudiantes retienen mientras que en el extremo contrario se sitúan Castilla y León, Navarra y La Rioja.
Desigualdad durante el covid-19. Mónica Martínez-Bravo y Carlos Sanz son los autores de un informe publicado por el Banco de España en inglés sobre la Desigualdad y el bienestar psicológico en tiempo del covid-19: evidencias desde España. El documento de 76 páginas concluye que en mayo de 2020 los españoles habían perdido de media el 16% de sus ingresos mensuales pre-pandémicos, aumentando este porcentaje entre las clases más bajas hasta el 27% mientras que los más ricos sólo sufrieron un descenso del 6,8%. Estas pérdidas de ingresos se agravaron para el caso de las mujeres, especialmente las de clase media con hijos, tal y como se puede ver en el siguiente gráfico. [visto a Javier G. Jorrín]
Oficinas bancarias. En plena polémica sobre el desabastecimiento de servicios financieros a los más mayores como consecuencia de la digitalización de la banca, Maldita.es ha publicado un mapa con las oficinas que tiene cada banco a lo largo y ancho de España. Caixabank es con mucha diferencia la entidad bancaria con más oficinas, con algo más de 5.800, lo que representa el 28% del total. Esta cifra es el doble que las del segundo banco, Caja Rural, con más de 2.300. Aunque parezcan números elevados, “no es ni la sombra de lo que era hace tan sólo 10 años, cuando había el doble de oficinas en el país. Actualmente en España hay el mismo número que las que había en el año 1977 y tan sólo en el trimestre entre junio y septiembre de 2021 han desaparecido unas 1.500”, tal y como explica el reportaje.
Bonus track internacional. The Economist ha analizado 320.000 éxitos en Spotify en 70 países para investigar cómo las canciones en otros idiomas están ganando popularidad en detrimento de las canciones en inglés, especialmente en los países hispanos. El interactivo final muestra las canciones más escuchadas en Spotify cada semana desde 2017 en 68 países y en qué idioma están cantadas. Una de las autoras del reportaje, Olivia Vane, explicó en la newsletter semanal de la sección de datos de The Economist —Off the Charts— cómo había diseñado y producido este interactivo en forma de matriz de filas y columnas.