Importante disminución de los casos covid19 a nivel mundial

Consultores estratégicos en Ciencia de Datos

Importante disminución de los casos covid19 a nivel mundial

Covid disminuye

La esperada disminución del COVID-19

Desde hace varias semanas,  se viene observando una importante disminución de los casos y  que los expertos no han sabido explicar,  pero que se presume que podría estar relacionada varios factores etre ellos la suma de la inmunidad natural mas la inmunidad de rebaño, la presencia de anticuerpos heterologos y otra serie de factores que ensu conjunto podrian explicar  esa Importante disminución de los casos covid19 a nivel mundial.    Veamos un análisis detallado utilizando los datos disponibles.

*por Dr. Juan I. Barrios MD – M.Sc. – D.Sc.

Antecedentes

La primera señal de éste fenómeno se empieza a observar en el sitio https://www.worldometers.info/coronavirus/

Casos diarios de covid disminuyen

En este sitio se obtiene esta  gráfica que resume los informe de 210 países desde el inicio de la Pandemia.  Hay una clara tercera ola, con un pico de 845.000 casos en un solo día.( 8-1-2021), pero aA partir del 10 de Enero, ese número se reduce a  de menos de 500.000 casos por día. Esa tendencia se ha mantenido por dos semanas  y  continúa en franco descenso,  como se puede ver en la gráfica de arriba donde la línea de color azul, muestra esa  tendencia,  que se calcula con una técnica estadística conocida como “promedios móviles” ( en este caso de 7 días)  lo que “suaviza las tendencias y picos individuales.

Mucha gente pregunta y ¿ porqué las muertes siguen altas y las unidades de UCI todavía siguen abarrotadas,  ?   La explicación es porque:  el proceso de contagio y evolución de los casos viene semanas e incluso meses por detrás…

¿Pero esa Importante disminución de los casos covid19  a nivel mundial, realmente son todos los países vienen disminuyendo ? o son unos pocos los que están contribuyendo a ese descenso ?

Hice este gráfico para los 210 países que reporta diariamente sus casos, para ver si esto es  una tendencia de unos pocos o es una tendencia global.

 

Como se puede observar esta tebdencia es global, pero aAdicionalmente a este ejercicio,  hicimos un ejercicio para calcular la tasa de contagio ( Tasa Rt o R efectiva )  a partir del número R,  para todos los países para los últimos 5 meses.

Se dice que: El valor del Índice de contagio o Numero R  ( Rt ) es el indicador que debería estar  permitiendo  administrar la Pandemia del COVID19

El número R o tasa de contagio

Los líderes políticos, los epidemiólogos, los economistas y hasta los informáticos están obsesionados con el valor del número R en estos últimos meses.

En epidemiología,  se dice que el número básico de reproducción, o ritmo reproductivo básico (que en realidad NO es una tasa sino una ratio) es el número promedio de casos nuevos que genera un caso dado,  a lo largo de un período infeccioso.  Dicho de otra forma,  es la cantidad de personas que se infectan en promedio a partir de una persona enferma.

Hay enfermedades como el Coronavirus que el R0 tiene un valor promedio  de 2.5 o sea que una misma persona puede contagiar en promedio a 2.5 personas.  El R0 de otras enfermedades infecciosas puede llegar a ser hasta de 18,  por ejemplo en el caso del sarampión lo que la hace una enfermedad altamente contagiosa.

Este concepto se aplica específicamente a una población de personas que previamente estaban libres de infección y no han sido vacunadas.

Indice reproductivo básico para diversas enfermedades

Cómo calcular el Índice R0.

Es imposible medir el R0 directamente, por lo que tenemos que hacer es:  estimarlo. Afortunadamente, hay muchas formas de hacerlo. A lo largo de este documento presentaré en detalle, un método particular descrito desde el año 2008 por Bettencourt y Ribeiro.  Este documento se titula : “Estimación bayesiana en tiempo real del potencial epidémico de enfermedades infecciosas emergentes”.  Esa estimación utiliza los algoritmos bayesianos (teorema de Bayes)  para estimar el valor más probable de R0 y también devuelve un intervalo posible a modo de límites para el valor verdadero de R0.  De esta forma, aunque no conocemos exactamente su valor conoceremos con mucha probabilidad, dentro de que rango se encuentra su valor.

El método tradicional de cálculo del R0

Dentro de los muchos modelo epidemiológico que se utilizan para describir las epidemias,  se encuentra el modelo SIR (susceptible–infectado–recuperado), este es un modelo relativamente sencillo ideado para describir epidemias, los individuos empiezan como susceptibles ante un agente patógeno determinado,  luego se infectan, y al final se recuperan o sea pasan por las tres etapas ó categorías.  Ese movimiento dentro de las categorías es lo que el modelo describe.

Para entender ese movimiento entre categorías se define un sistema de tres ecuaciones diferenciales ordinarias (EDO), a saber:

1) dS = – βI S dt N

2) dI = βI S – γ∗I dt N

3) dR =γ∗I dt

Acá conviene saber que:  β es la tasa de transmisión, “γ” es la tasa de recuperación (o la inversa del período infeccioso) y “N” es el tamaño total de la población, de manera que N = S + I + R. En el modelo ordinario de la ecuación se da por sentado que no hay nacimientos ni muertes.

Al comienzo del brote o epidemia (t será = 0) además suponemos que la población está constituida totalmente por individuos susceptibles y que además un solo individuo está infectado. Con este modelo, si la tasa de transmisión excede a la de recuperación (es decir, β/γ > 1), la enfermedad se propagará (dI/dt > 0). Ver gráfica del modelo SIR más adelante.

El modelo Bayesiano

El algoritmo original de Bettencourt & Ribeiro para estimar el valor de R efectivo ó Rt es una función de cuántos casos nuevos aparecen cada día. La relación entre el número de casos de ayer y el número de casos de hoy nos orienta sobre el valor de R0. Sin embargo, no podemos utilizar sólo este dato, ni  confiar demasiado en los datos de un único día para estimar R0, ya que toda la logística de recolección de datos incorpora una cantidad enorme de sesgos.  Ver mi post sobre este tema en este enlace:

Sin embargo, utilizando el Teorema de Bayes, podemos de la información de casos diarios,  ajustar el verdadero valor de R0 .  Nos  acercáremos mas  al valor real de Rt  a medida que disponemos  de más datos de los casos nuevos que se presentan cada día.

Distribución de Probabilidad

Acá es importante entonces traer  el concepto de la distribución de probabilidad:

En teoría de la probabilidad y estadística, la distribución de probabilidad de una variable aleatoria es una función que asigna a cada suceso definido sobre la variable la probabilidad de que dicho suceso ocurra. La distribución de probabilidad está definida sobre el conjunto de todos los sucesos y cada uno de los sucesos es el rango de valores de la variable aleatoria. También puede decirse que tiene una relación estrecha con las distribuciones de frecuencia. De hecho, una distribución de probabilidades puede comprenderse como una frecuencia teórica, ya que describe cómo se espera que varíen los resultados. (Wikipedia)

La distribución de probabilidad está completamente especificada por la función de distribución, cuyo valor en cada x real es la probabilidad de que la variable aleatoria sea menor o igual que x.

La distribución de Poisson recordemos que se utiliza para describir eventos  independientes, y por eso resulta particularmente útil en nuestro caso.

Conectando LAMBDA y el valor de Rt

La idea clave para hacer que esto funcione es darse cuenta de que hay una conexión entre  λ y Rt.

dónde “γ”,   es el recíproco del intervalo en la serie ( aproximadamente 4 días para COVID19 ). Como sabemos que en cada nuevo caso cuenta el día anterior, ahora podemos reformular la función de probabilidad como un parámetro de Poisson mediante la fijación de k y empezar a mejorar nuestro valor de Rt.

Este es el cambio realizado al modelo Bayesiano 

Para realizar esta actualización del modelo bayesiano , debemos multiplicar la probabilidad por la del día anterior y así ir obteniendo las posteriores. Si hacemos esto,  usando el producto acumulado día por día, obtenemos un gráfico como éste y que vamos a llamar el cálculo del día posterior.

Valores más probables de Rt y el Indice de Mayor Densidad (IMD)

Finalmente,  vamos  a trazar los valores mas probables para Rt y un Intervalo de mayor densidad o IMD a lo largo del tiempo.  Acá podremos apreciar más claramente como varía nuestra certeza sobre estos valores.  La zona gris es la zona de los límites superior e inferior de probabilidad,  dentro de los cuales estimamos que:   con un 95% de probabilidad el verdadero valor de Rt se encontrará dentro de esos límites.

Tomando los datos del mundo real

Hay una importante cantidad de repositorios de los datos de covid19 a nivel mundial,  que actualizan diariamente las cifras de COVID-19.  Estos sitios recolectan en la mayoría de los casos de forma automática,  ( a través de técnicas de Webscraping ) las cifras que los gobiernos de mas de 220 países publican cada día que nos permitirtanb comprobar esta importante disminución de los casos covid19 a nivel mundial

En nuestro caso utilizaremos el repositorio de la Universidad de Johns Hopkins,  el cual se encuentra también replicado en el MEGA portal de Our World in Data 

El  formato de los datos que se puede obtener es similar al que presento acá abajo ( este es apenas un segmento de esos mega archivos que se pueden descargar de estos repositorios)

Como se puede ver éste archivo tiene  muchas variables pero solo vamos a utilizar  (fecha, Ubicación, nuevos casos, nuevas muertes. total casos, total muertes)

Webscraping de datos de Costa Rica del repositorio de Johns Hopkins University

Consideraciones Iniciales de nuestro análisis de Rt

Echando un vistazo al Ejemplo de Costa Rica, necesitamos comenzar diciendo que el modelo funciona cuando hay  un número constante de casos cada día.  En algunos casos  el hecho de que algunos “países” reporten cero casos en un determinado día,  trastoca  el modelo ( por motivo  de la división por cero )  y lo hace iniciar de nuevo.

Para obtener una  mejor visión de cómo podrían ser los datos “verdaderos”, se aplicó un filtro gaussiano a las series de tiempo . Obviamente, éste es un truco mas de orden visual que busca suavizar la curva . Usualmente esto se hace,  ya que como lo expuse en éste articulo previo es un hecho de que todo el conjunto de procesos que lleva el procesamiento de los datos en el mundo real,  no es tan estocástico como el que al final se presenta en un informe del sistema de salud debidamente validado y ajustado. Veamos una gráfica de los casos diarios de COVID19 en Costa Rica actualizado al 7-2-2021

Los datos actualizados de COVID19 en Costa Rica  se pueden ver en mi Dashboard  que se actualiza en forma dinámica

 

Casos covid19 Costa Rica

Los primeros resultados de Rt ( valor de R0 efectivo)

A continuación, se pueden ver todos los días  de esta distribución del día “posterior”   graficados simultáneamente. Las observaciones posteriores comienzan sin mucha confianza (con una gráfica más amplia) y con el paso de los días se vuelven progresivamente más confiables  (o sea más angostos), esto sin duda es la clara representación de lo que al final significa el verdadero valor de   R0 en estecaso  representado por el valor de R efectivo o Rt

 

Trazado en el dominio de tiempo con valores “creíbles”

Como nuestros resultados todavía presentan  alguna incertidumbre, vamos a colocarlos en una tabla,  y les calcularemos un límite superior y un limite inferior probabilístico con el valor más probable de Rt,  utilizando el intervalo de mayor densidad.

La columna ML ( most Likelihood) se refiere al valor más probable de Rt en Costa Rica en los últimos 15 días. Las columnas “Low y High” se refieren a los límites superior e inferior de ese valor probable de Rt.  Nótese que los valores en el caso de Costa Rica, los datos de Rt (ML) y los valores High y Low presentan un rango muy amplio,  lo que le aumenta significativamente el nivel de incertidumbre a todo el modelo. Esto es una muestra mas , de lo difícil que resulta calcular el Indice R0 en el caso particular de Costa Rica.   Veamos la tabla de los valores de Rt ( Valor de R efectivo )  para Costa Rica al 8-2-2021

Valoresd el Indice Rt para Costa Rica

Valores históricos de Rt para Costa Rica

Esto se calculó con ayuda del intervalo de mayor densidad (IMD) y en este caso para el Período comprendido entre el 3-3-2020 y el  8-2-2021.  Esta tabla  se presenta diariamente con valores actualizados y se actualiza dinámicamente

  • Los datos actualizados de COVID19 para Costa Rica  se pueden ver en mi Dashboard

Si queremos ver con mas detalle de los últimos 4 meses del valor de Rt los invito a ver ésta gráfica.  Como se puede observar el indice ha estado en valores cercanos a uno pero a partir del 12 cde Enero 2022 disminuye a menos de 1y que nos ayuda a justificar numéricamente ésta Importante disminución de los casos covid19 a nivel mundial

Casos covid costa rica

Casos covid Costa Rica Oct 2020 -Feb 2021

 

Ahora veamos ese mismo dato del Indice de contagio Número R para todos los países. Desde el 1 Octubre 2020 al 8-2-2021.  Los puntos de color rojo reflejan los datos que representan un riesgo  de salud pública .

Evaluación del Indice Rt

Ahora,  si quisiéramos seleccionar cuales países con las cifras actuales se pueden considerarse  en control y cuales se pueden considerar fuera de control. lo podemos ver en estas gráficas:

 

1.) ¿ Cuáles son los países que basándose en el Indice  de contagios se podrían considerar  “EN CONTROL ” ?

2.) ¿ Cuáles son los países que basándose en el Indice  de contagios se podrían considerar  “NO BAJO CONTROL ” ?

3.) ¿ Cuáles son los países incluidos en el cálculo  ?

¿ Esto se puede considerar un ejercicio de simulación de COVID 19 ?

Si , efectivamente, en estos gráficos se observa en primer término los países en los que sus valores de Rt son lo suficientemente bajos ( incluyendo sus límites ) que pueden considerarse bajo control , y luego los países  en los  que los limites y valores son tan altos que no se pueden considerarse  bajo control.    Luego se presenta el grupo de los 210 países analizados y sus valores de Rt ordenados de menor  a mayor con el cálculo de valor más probable o (Most Likelihood) : es el modelo mas probable de que sea el que represente el valor de R0 en este caso el valor de Rt.

El uso de Indice de Mayor densidad y sus límites

Pero observe las barritas sobre cada una de las barras y que representa que tan grande es el espacio entre el límite superior y e inferior (  Límites de mayor densidad  (viene siendo como una medición del grado de  error en el cálculo del R0 para cada país.)  Este conjunto de gráficos permite explicar y comprobar efectivamente ésta Importante disminución de los casos covid19 a nivel mundial

Muchas Gracias

Bibliografía:

  1. Ávila Ayala Rocío, Inferencia en modelos epidemiológicos estocásticos

https://cimat.repositorioinstitucional.mx/jspui/bitstream/1008/549/1/TE%20625.pdf

  1. Ridenhour, Kowalik y Sahay, El numero reproductivo básico y sus consideraciones en salud pública.

https://www.scielosp.org/pdf/rpsp/2015.v38n2/167-176

  1. James Holland. Stanford University. Notes on R0

https://web.stanford.edu/~jhj1/teachingdocs/Jones-on-R0.pdf

  1. Vanesa Baters y Alana Biggers. What Is R0? Gauging Contagious Infections

https://www.healthline.com/health/r-nought-reproduction-number

  1. The New York Times, El explicador del R0 del coronavirus.

https://www.nytimes.com/2020/04/23/world/europe/coronavirus-R0-explainer.html

  1. Tom Britton. Basic Stochastic transmission models and their inference

https://arxiv.org/pdf/1801.09594.pdf

7.       Scire, Nadeau, Vaugnan y cols.  Reproductive number of the COVID-19 epidemic in Switzerland

https://smw.ch/article/doi/smw.2020.20271

  1. Kevin Systrom. Modelos de coronavirus en los EUA. Los EUA ante un  umbral peligroso

https://github.com/k-sys/covid-19/

  1. Predictive Monitoring of COVID 19. Singapur Data Driven Inovation Lab

https://ddi.sutd.edu.sg/

  1. Universidad  de Ginebra . Suiza. Swiss Data Science Center

https://renkulab.shinyapps.io/COVID-19-Epidemic-Forecasting/

Importante disminución de los casos covid19 a nivel mundial

Nota:

Se agradece la ayuda y participación de muchos amigos y colegas cientificos de datos,  salubristas y epidemiólogos alrededor del mundo, para realizar este  modelo.

* El autor es informático médico, máster en Business Intelligence y especialista en BIG DATA y Ciencia de Datos, aplica modelos de Machine Learning y de Inteligencia Artificial en el campo de la salud. Actualmente reside en Barcelona y colabora en la cátedra de Informática Médica de la Universidad de Barcelona, como profesor visitante.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

HTML Snippets Powered By : XYZScripts.com