miércoles, 6 de mayo de 2020

Variables determinantes en la propagación del Covid 19 (3): Análisis de conglomerados (clusters)

Por: J.R. Torregrosa

Para resolver el problema del conjunto del país,  bajo el criterio de las mismas variables, densidad, población, temperatura y presupuesto sanitario público, junto con los casos y los muertos a fecha 31 de abril, he realizado un análisis de conglomerados, cuyo resultado es el siguiente dendograma.






Cluster 0:

En primer lugar tenemos el grupo más numeroso, el más homogéneo en cuanto a las distancias de las medias de cada comunidad con la del conjunto del grupo, compuesto por las comunidades de Murcia, Baleares, Cantabria, Canarias, Asturias y Extremadura, a las que posteriormente se une La Rioja, que se distancia un poco del resto. Los factores de regresión lineal utilizados anteriormente tienen una baja significación dentro de este grupo.

Se caracterizan fundamentalmente por ser las de menor mortaldad a causa de la pandemia; muestran gran homogeneidad en las variables determinantes, excepto en la densidad de población con un arco que abarca desde los 293,89 habitantes por km² de Canarias hasta los menos de 26 (25,63 habitantes por km² ) de Extremadura como ya se ha comentado y se puede ver en el dendograma.



La Rioja muestra una ligera desviación con respecto al resto del grupo, principalmente debida a ser la comunidad que menor número de mayores de 65 años tiene dentro del grupo, lo que no la lleva a ser la de menor mortaldad, la Región de Murcia, y ser la que mayor número de contagios presenta.

Cluster 1:

Este cluster esta formado por Navarra, Aragón y Galicia, muy cercano al anterior, de hecho La Rioja podría formar parte de cualquiera de ellos, la principal diferencia es la mayor mortalidad dentro de estas comunidades, la cual supera ya los 400 fallecidos.



Se muestra muy homogénea en cuanto a la inversión sanitaria, Galicia se diferencia de Navarra y Aragón en su temperatura media y en el mayor número de mayores de 65 años, también supera, casi dobla, en número de contagios a sus, comunidades, compañeras de grupo, existiendo una diferencia muy importante en cuanto a densidad de población, probablemente la razón de los contagios, lo que la acerca mucho al siguiente grupo.

Cluster 2:

Nos encontramos en este caso con la Comunidad Valenciana, Andalucía y Pais Vasco, la diferencia con el grupo anterior es que en este caso se superan las 1.000 muertes por comunidad y los 10.000 contagios.



En cuanto a inversión sanitaria es el más heterogéneo de los grupos, ya que nos encontramos con la mayor inversión sanitaria en el País Vasco junto la inversión más baja la de Andalucía, sin embargo se compensa con la diferencia de temperatura, también tenemos un alto número de personas de más de 65 años en Andalucía frente al bajo de el País Vasco; a estas comunidades se les agrega la Comunidad Valenciana, con un bajo número de contagios, pero similar número de muertos. Cabe destacar también la diferencia entre Andalucía y las otras dos comunidades en cuanto a densidad de población.

Cluster 3:

Este grupo abarca prácticamente toda la meseta, ya que en el están las dos Castillas, Castilla la Mancha y Castilla León, y ya marca una diferencia con las comunidades que hemos visto hasta ahora superando los 15.000 casos y los 1.500 muertos.


Gran homogeneidad interna en cuanto a las variables, con la salvedad de las temperaturas, sensiblemente (10o) más bajas en Castilla León, por lo demás están muy parejas ambas comunidades; sin embargo las consecuencias son distintas no tanto en cuanto a positivos superior en Castilla León, como en cuanto a muertos donde Castilla – La Mancha tiene una cifra sensiblemente más alta un 34,52% en concreto, debido principalmente a casos concretos como pueden ser Ciudad Real y el problema de las residencias de ancianos.

Cluster 4:

Para terminar tenemos el grupo más alejado del resto y con mayor heterogeneidad interna, formado por los dos grandes núcleos del país, Cataluña y Madrid.


Si bien Cataluña esta por debajo del País Vasco en densidad de población, Barcelona y su área metropolitana son junto con Madrid los dos conurbaciones más importantes de la península Ibérica.

Con una inversión sanitaria similar han coincidido prácticamente en temperaturas durante los dos últimos años, la mayor densidad de Madrid precipita el desenlace fatal que la pandemia ha tenido en esta comunidad, sin embargo es posible que extrapolando el resto de Cataluña la situación en Barcelona sea muy similar.

Epilogo:

En definitiva, las variables actúan de diferente manera según los grupos; así la variable inversión sanitaria sin ser determinante tiene una repercusión significativa y no lo es más por que las diferencias de esta inversión entre comunidades son similares, en el único caso que se da una diferencia importante, otra variable, la temperatura, compensa su repercusión ya que la comunidad con el presupuesto sanitario más bajo, Andalucía, tiene temperaturas sensiblemente más altas  que la que tiene el presupuesto más alto País Vasco; en la comparación entre Cataluña y Madrid si que se ve que el  mayor presupuesto repercute tanto en un menor volumen de contagio como en un menor número de muertos.

La variable densidad es importante en los lugares con alta densidad, para Madrid y País Vasco la alta densidad de población supone un handicap a la hora de enfrentarse a la pandemia, un presupuesto sanitario más alto hace que en el País Vasco la contención sea mucho mayor. En los lugares con densidad baja no termina de haber un detonante claro de los contagios, es el caso  fundamentalmente de algunas de las comunidades del cluster 0, el caso de Murcia puede venir determinado fundamentalmente por el clima mientras que en Baleares o Canarias, independientemente de la densidad de población, el clima y la insularidad han podido ser condicionantes para un control más eficaz de la pandemia.

En el Cluster 1 Navarra comparada con Galicia no da resultados determinantes en cuanto a población mayor de 65 años y fallecimiento por covid-19, la variable densidad puede explicar la proporción de muertos entre estas dos comunidades así como la diferencia de presupuesto sanitario, que sin ser excesiva, dentro de los parámetros en que nos movemos, si puede ser suficiente.

Como ya comenté en otro articulo, las circunstancias han hecho que la Comunidad de Madrid haya sufrido esta pandemia de forma severa, un presupesto sanitario bajo, unas malas temperaturas, 10o, una alta densidad de población y un número elevado de población de más de 65 años han desarrollado una espiral perfecta para el contagio del virus.

En otros lugares pequeños, por ejemplo Soria, la falta de asistencia o el aislamiento de los pacientes para ser atendidos han condicionado los tratamientos y por lo tanto la expansión del covid19.

Falta por determinar la importancia del éxodo de las grandes ciudades justo antes de que se decretara el estado de alarma, o la de la eliminatoria de Champions league entre Valencia y Atalanta con desplazamientos a lugares y desde lugares con alto grado de contagio.

Fuentes y medidas:

Medición de las variables:

Los presupuestos sanitarios están en euros por habitante, la temperatura en grados centigrados, la densidad de población en habitantes por km² y la población de más de 65 años en miles de personas.

Todas las variables se han normalizado a nivel nacional para llevar a cabo las regresiones lineales.

Fuentes:

los datos han sido obtenidos de:

  • Banco mundial https://datos.bancomundial.org/

  • Ministerio de sanidad consumo y bienestar social https://www.mscbs.gob.es/

  • Agencia estatal de meteorología http://www.aemet.es/

  • Instituto nacional de estadística https://www.ine.es/

  • Wikipedia http://www.es.wikipedia.org




Factores determinantes en la propagación del Covid 19 (2): Análisis del caso español, Regresión

Causas y variables en el lugar de destino, España:

Por: J.R. Torregrosa

Una vez en el lugar de destino del contagio, en este caso España,  el conjunto de Europa o los EEUU, existen una serie de factores que favorecen o frenan la expansión de la enfermedad. Bajo mi punto de vista los principales factores son: 

El clima, a mayor temperatura ambiente, menor capacidad de supervivencia del virus. Cabe la posibilidad que este no sea el único factor climático influyente, pero ante la variabilidad de otros como puede ser humedad del aire, presión atmosférica o precipitaciones, tomare unicamente la  temperatura como variable climatica.

La densidad de población, a mayor densidad mayor número de interacciones y por lo tanto mayor posibilidad de contacto. Existen interacciones independientemente de la densidad de población, interacciones profesionales, comerciales, laborales…, pero las que afectan al tiempo libre son las que vienen determinadas por la densidad de población independientemente de que sean voluntarias o no.

La concurrencia de grupos de riesgo: vale la pena decir que si bien el grupo de riesgo somos todos, los más proclives a desarrollar la enfermedad de forma grave y con consecuencias letales son los mayores de 65 años, tomaré esta población como grupo de referencia. 

La fortaleza del sistema sanitario, orientado en dos sentidos, por un lado su desarrollo y por otro el acceso de la población al mismo; en este caso la variable es la inversión del sector publico en este sistema sanitario.

Ninguno de estas variables es capaz de explicar por si sola las condiciones que permiten al virus desarrollarse, sin embargo en conjunto si consiguen dar pautas de las causas de su expansión.

Antes veamos por separado cada una de ellas en España, según cada autonomía. Es evidente que los focos del virus son puntuales y trabajar con medias y territorios amplios como pueden ser las comunidades autónomas puede ser un factor determinante para que los resultados sean imprecisos,  pese a esto puede darnos una serie de referencias de cuales son las variables con mayor grado de determinación en la expansión del virus.

La que mayor capacidad de explicación tiene es la densidad, la proximidad es sin duda la principal fuente de contagio.

Fuente: Instituto Nacional de Estadística




Se puede ver en las gráficas de correlación lineal que por si sola la densidad de población llega a explicar un 52,49 % de los contagios y hasta un 60% de la mortaldad que esta produciendo el covid-19.

En segundo lugar la concurrencia de grupos de riesgo, en este caso los mayores de 65 años, todos estamos expuestos a la enfermedad pero este grupo tiene mayor propensión al contagio y menos probabilidad de superarla.

Fuente: Instituto Nacional de Estadística



En este caso le grado de explicación es menor, tanto en el caso del contagio con un 50.03% como en el caso de la mortaldad con solo un 40,9 %; se podría decir que aún siendo los ancianos los más afectados, existen otros grupos, el problema de algunas residencias de ancianos, y el agrupamiento de este grupo de riesgo hace que terminen siendo las principales victimas de la pandemia.

Hasta ahora, no hemos descubierto nada nuevo, tanto la cercanía de las personas como el pertenecer al principal grupo de riesgo, en este caso los mayores de 65 años favorece tanto el contagio como la gravedad de la enfermedad, estas dos variables por si solas no llegan a tener suficiente valor predictivo tanto sobre el contagio como sobre la mortaldad, en conjunto las dos variables llegan a explicar hasta un 75% de las causas de la expansión del coronavirus.

Nos centraremos ahora en las variables que pueden frenar tanto la transmisión del virus como la extrema gravedad que puede conducir a la muerte, estas variables son:

En primer lugar hablare de el clima, el análisis se ha hecho en base a la temperatura media por comunidad autónoma. Se trata de un factor relativamente significativo, no se puede establecer una correlación importante, sin embargo se intuye que a mayor temperatura menor número de casos.

                                                                    Fuente: Instituto Nacional de Estadística


Se puede ver en la gráfica que en términos generales a medida que baja la temperatura suben los casos, si bien existen casos que no siguen la pauta como puede ser el de Castilla La Mancha.




La aportación del clima a la correlación es muy sutil, prácticamente nula, pese a esto supone un aporte suficiente a los factores. En cuanto a la ultima variable, la inversión sanitaria, de la gráfica se puede intuir cierta relación inversa, pero en ningún caso determinante.



Las dos comunidades autónomas con menor inversión tienen  comportamientos diferentes, mientras Andalucía solo supone un punto de inflexión, Madrid la segunda con menor presupuesto es la comunidad autónoma más afectada y el País Vasco con el presupuesto medio más alto esta a un nivel similar que Andalucía en lo que se refiere a defunciones.

La gráfica nos muestra un alto grado de dispersión en la nube de puntos, por lo que la relación entre inversión sanitaria y mortaldad es claramente insuficiente para que exista correlación entre ambas, ya que como he dicho anteriormente Andalucía y País Vasco con el menor y mayor presupuesto medio entre los años 2002 y 2017 se encuentran prácticamente al mismo nivel, mientras que Madrid con la segunda inversión más baja se dispara en el número de defunciones. Cabe destacar en este aspecto que lo parejo de los presupuestos, con una diferencia inferior a los cuatrocientos millones de € entre el presupuesto más alto y el más bajo.

Los factores conjuntos de las cuatro variables:

El factor 1, contagio esta formado por tres de las cuatro variables: densidad de población, personas mayores de 65 años y clima, la relación es la siguiente:

         Factor 1=(densidad de población X personas mayores de 65 años)/ (clima)


Como se puede ver la R2 (R cuadrado) no llega a ser lo suficientemente alta como para poder establecer una relación entre el factor y la variable contagio, pero si alcanza a explicar el 82% de la variable contagio. Existe en segundo lugar en la distribución de la nube de puntos dos de ellos, correspondientes a Cataluña y Madrid, que están muy distanciados del resto, la razón es el peso de las variables del numerador del factor, densidad de población y personas mayores de 65 años, lo que sin duda distorsiona la correlación, y que determina la diferencia entre estas dos comunidades y el resto de España. Sin embargo no se pueden ignorar estos puntos ya que se trata de las comunidades autónomas con mayor número de contagiados.

Factor 2, mortaldad, de este factor forman parte las cuatro variables, densidad de población y mayores de 65 años, directamente proporcionales en el numerador y inversión sanitaria y clima como inversamente proporcionales en el denominador.




Factor 2 =(densidad de población X personas mayores de 65 años)/ (clima X inversión en sanidad)



Este caso es similar al anterior, el factor no es lo suficientemente explicativo, existe un grupo de puntos situados en el vértice inferior representando al conjunto del país, y situados no sin cierta simetría y luego dos puntos que se distancian que se corresponden con Cataluña en el centro y Madrid en el extremo superior derecho.

Estos casos aislados pervierten la relación entre el factor y la variable mortaldad.

El peso de las variables del numerador hace que la distribución adopte esta forma pero también se puede decir que sobre todo en Madrid se han reunido una serie de condiciones que han desatado la pandemia en su versión más furiosa; la densidad más alta de habitantes por km², en torno a los 820, un número superior al millón de personas con 65 o más años, un clima frío y el segundo presupuesto en sanidad mas bajo de España. Dentro del país podemos distinguir varios escenarios, pero el más terrible y el que representa la pandemia en nuestro país es sin duda el de Madrid, si este escenario no se hubiera dado, los niveles de contagio y de mortaldad hubieran sido menores y estarían en consonancia con el resto de Europa, algo por encima porque la población en España es inferior a la de Francia, Reino Unido o Alemania.

Fuentes y medidas:

Medición de las variables:

Los presupuestos sanitarios están euros por habitante, la temperatura en grados centigrados, la densidad de población en habitantes por km² y la población de más de 65 años en miles de personas.

Todas las variables se han normalizado a nivel nacional para llevar a cabo las regresiones lineales.

Fuentes:

los datos han sido obtenidos de:

  • Banco mundial https://datos.bancomundial.org/

  • Ministerio de sanidad consumo y bienestar social https://www.mscbs.gob.es/

  • Agencia estatal de meteorología http://www.aemet.es/

  • Instituto nacional de estadística https://www.ine.es/

  • Wikipedia http://www.es.wikipedia.org

  • Datos macro https://datosmacro.expansion.com/


Factores determinantes en la propagación del Covid 19 (1): Covid-19 en Europa

Por: J.R. Torregrosa

Resulta complejo saber cual es la causa de la propagación de la pandemia, como preámbulo vale decir que a nivel mundial esta crisis tiene mucho en común con la peste negra, por su alta incidencia (nada que ver a nivel de mortaldad), y en general con las epidemias medievales y de la edad antigua, las cuales solían entrar por los puertos en los barcos que se dedicaban al comercio, a diferencia de la gripe de 1918 que la trajeron las tropas americanas movilizadas en la I Guerra Mundial.

En este caso se podría decir que la enfermedad ha entrado por los aeropuertos, una consecuencia de la globalización y de la popularización de los viajes, como servicio de mercado, tanto de personas como de carga.



El número de vuelos a nivel global se ha, prácticamente, duplicado desde principios de siglo; este trasiego de personas y mercancías ha sido el vehículo para la difusión del virus, lo que ha hecho que un virus con un menor grado de transmisión que el Sars de 2002, se haya extendido de forma espectacular, más focos de contagio, pese a la menor difusión, supone una expansión mayor.

Nota: R0 es un coeficiente de transmisión del virus, representa el promedio de personas infectadas por un solo enfermo al comienzo de la enfermedad, Si R0 es inferior a uno, con el paso del tiempo el número de recuperados representará una parte apreciable de la población total. El SARS de 2002 tenía un R0 entre 2 y 5, el Covid 19 tiene un R0 de entre 1,5 y 2,5.

fuente: https://www.newtral.es/las-matematicas-de-la-epidemia-asi-se-extiende-el-coronavirus/20200201/

Tenemos pues una enfermedad que se transmite desde múltiples puntos lo que hace mucho más difícil encontrar el punto de origen y aislar a los primeros contagiados, lo que facilita su propagación.

Fuente: es.wikipedia.org

Como se puede observr en los mapas cada país europeo tiene sus propias características, En Alemania por su alta densidad los casos se reparten por todo el país con mayor incidencia en el sur, Babiera y Baden y al oeste Renania del norte Westfalia. 

En Francia la región central esta poco afectada, probablemente por su carácter rural y son las regiones urbanas, al noreste las más afectadas, Metz, Estrasburgo al Este la ciudad de Nantes y al sur la ciudad de Marsella y París que aparece en el recuadro superior izquierdo del mapa de Francia.

Italia esta afectada principalmente en el  norte Lombardia y Piamonte, con los dos grandes nucleos del pais transalpino, Turín y Milán.
En España podemos distinguir varios escenarios, pero el más terrible y el que representa la pandemia en nuestro país es sin duda el de Madrid, si este escenario no se hubiera dado, los niveles de contagio y de mortaldad hubieran sido menores y estarían en consonancia con el resto de Europa, algo por encima porque la población en España es inferior a la de Francia, Reino Unido o Alemania.

Fuentes y medidas:

Medición de las variables:

Los presupuestos sanitarios están en euros por habitante, la temperatura en grados centigrados, la densidad de población en habitantes por km² y la población de más de 65 años en miles de personas.

Todas las variables se han normalizado a nivel nacional para llevar a cabo las regresiones lineales.

Fuentes:

los datos han sido obtenidos de:

  • Banco mundial https://datos.bancomundial.org/

  • Ministerio de sanidad consumo y bienestar social https://www.mscbs.gob.es/

  • Agencia estatal de meteorología http://www.aemet.es/

  • Instituto nacional de estadística https://www.ine.es/

  • Wikipedia http://www.es.wikipedia.org