Ciencia de datos y COVID19 – Los test diagnósticos –

Consultores estratégicos en Ciencia de Datos

Ciencia de datos y COVID19 – Los test diagnósticos –

Existe una relación entre  el número de casos de COVID19 y las pruebas efectuadas ?  Hablaremos de esto a continuación en Ciencia de datos y COVID19 – Los test diagnósticos –

Autor:  Juan Ignacio Barrios *

Sin duda hay una estrecha relación entre pruebas de COVID19 y el número de casos.  Se asume que habiendo una gran cantidad de personas asintomáticas, si realizamos muchas pruebas vamos a encontrar muchos de esos casos. Recordemos que el 90% de los casos cursan su enfermedad de manera asintomática o con síntomas muy leves .  Si se realiza un buen diagnóstico y una buena cobertura de las pruebas de ese 10% sintomático un 15% necesitaría hospitalización  y un 5% necesitaría una cama en Unidades de cuidado Intensivo “UCI”   . Estos números varían de una realidad a otra básicamente por la GRAN ASIMETRÍA que existe en los países en la realización de pruebas. En Cataluña  llegamos a ver que el 40% de los casos ameritaban hospitalización pero no necesariamente porque el virus era mas agresivo sino porque no se realizaban suficiente cantidad de pruebas.

En Costa Rica al inicio de la Pandemia se realizaban pruebas muy selectivas dirigidas a pacientes sintomáticos y a sus contactos mas cercanos . Es muy posible que desde hace muchos meses,  el número de casos que teníamos era mucho mayor pero no los lográbamos identificar.  Al realizar pruebas a un numero mayor de personas en grupos de riesgo ( fábricas, fincas, industrias, comunidades hacinadas)  se está teniendo una mejor fotografía de la situación.

Empecemos hablando sobre los tipos de pruebas

 Ciencia de datos y COVID19 – Los test diagnósticos – Los tipos de pruebas

En resumen hay dos tipos diferentes de pruebas: pruebas cuantitativas y cualitativas

  • Las  pruebas CUANTITATIVAS están orientadas al  diagnóstico ,  nos dicen  si el paciente tiene una infección por coronavirus activa y por tanto debe tomar las medidas para poner en cuarentena o aislarse de los demás. Actualmente hay dos tipos de pruebas de diagnóstico: pruebas moleculares (RT-PCR) que detectan el material genético del virus, y las pruebas inmunológicas.

 

  • Las pruebas CUALITATIVAS están orientadas a valoraciones mas rápidas y con otros fines principalmente epidemiológicos. Usualmente utilizan métodos rápidos (15 minutos)es un método MUY utilizado ( ver gráfica  )  y busca identificar anticuerpos producidos por el sistema inmune en respuesta a una amenaza, como un virus específico.   Recordemos que los anticuerpos nos ayudan a combatir las infecciones, pero pueden tardar varios días o semanas en desarrollarse después de una infección.  Sin embargo,  luego pueden permanecer en la sangre durante varias semanas después de la recuperación, en algunos casos pueden permanecer muchos meses, incluso años , lo que actúa como una memoria inmunológica que le recuerda al cuerpo como atacar el “enemigo conocido” . Debido a esto, las pruebas de anticuerpos no deben usarse para diagnosticar una infección activa por coronavirus. En este momento, los investigadores no saben por cuanto tiempo será usted inmune al virus, después de haber tenido la enfermedad. Los estudios realizados muestran qua en algunos casos,  esa inmunidad dura pocas semanas.

 

Veámoslas en detalle:

1.) Pruebas moleculares o pruebas PCR (ARN)

Muchas compañías y laboratorios han desarrollado este tipo de  pruebas para diagnosticar COVID-19 basadas en la detección del material genético del virus en una muestra de la nariz o la garganta del paciente.

Los pasos típicos en este tipo de pruebas moleculares para el coronavirus son:

  1. Su médico ordena una prueba COVID-19.
  2. Un profesional de la salud usa un hisopo estéril especializado para recoger la mucosidad de la nariz o la garganta.
  3. Se coloca el hisopo en un recipiente estéril y lo sella para transportarlo a un laboratorio.
  4. Durante el proceso de envío, el hisopo debe mantenerse dentro de un cierto rango de temperatura para mantener vivo el virus y que la prueba sea precisa. La muestra debe llegar al laboratorio dentro de las 72 horas después de tomada la muestra .
  5. Un técnico de laboratorio mezcla químicos con el hisopo para extraer el material genético de cualquier virus que pueda estar en el hisopo. (ver técnica mas adelante)

Procedimiento en el laboratorio:

Una vez que se recibe la muestra, se deben eliminar las proteínas y otras moléculas innecesarias , aislando tan sólo el ARN. Lo ideal es que la muestra solo incluya el material genético de la persona ya que es una prueba muy sensible y cualquier contaminación externa produciría resultados incorrectos.

Las enzimas del kit transcriben el ARN en el ADN, que se amplifica para permitir la detección de virus mediante el uso de un aparato conocido como termociclador,  que genera un programa de temperaturas para producir aproximadamente 35 mil millones de copias de ADN viral para cada cadena de ARN viral que estuvo originalmente presente.

Se utilizan luego unas sustancias o reactivos llamados marcadores fluorescentes que son capaces de unirse al ADN amplificado y producir luz, que un equipo especializado puede leer.  Si la intensidad de la luz producida alcanza un cierto umbral, esta se clasifica con un resultado positivo. Durante la prueba se registran el número de ciclos de temperatura de PCR que se requerían antes de alcanzar el umbral de fluorescencia y esto proporciona una estimación de la cantidad de virus presente en la muestra del paciente. ( De ahi el nombre cuantitativa)

¿Qué detecta el test de RT-PCR?

La RT-PCR detecta si el ARN viral está presente o no en las muestras de un paciente. Generalmente lo que se logra amplificar son la proteína Spike, la proteína N o la envoltura del virus. El resultado de la RT-PCR indica el número de ciclos necesario para detectar un umbral de detección del ADN, de tal forma que a más virus presente en la muestra, menor número de ciclos necesarios para obtener la señal.

¿Qué significa el resultado obtenido?

Una prueba de RT-PCR es altamente sensible y su resultado ya sea positivo o negativo aporta información sobre si el virus está presente o nó en el paciente.

Resultado positivo de la prueba: – Un resultado positivo de la PCR significa que la persona de la que se tomó la muestra está actualmente infectada por el virus.
Resultado negativo de la prueba: – Un resultado negativo de PCR podría significar que: la persona no está infectada actualmente por este virus, o que el virus no está presente en el lugar donde se tomó la muestra, también un falso negativo podría ser fruto de una muestra de baja calidad o que es demasiado pronto o demasiado tarde en la infección para detectar la replicación del virus. Esta es la razón por la cual los resultados negativos de la prueba requieren que se tomen nuevas muestras de pacientes unos días después para reducir la posibilidad de clasificar  incorrectamente a una persona infectada.

La prueba RT-PCR no puede detectar si una persona tuvo el  virus y superó la enfermedad COVID-19,   sólo detecta cuando hay virus activo.

Ventajas y Limitaciones

Ventajas: es muy sensible . se utiliza en muchos laboratorios, detecta la infección en curso

Desventajas: No detecta los que estuvieron enfermos, es necesario tomar muestras de nariz y flemas porque a veces sólo se encuentra en uno o en otro material.

 

2 a. ) Pruebas de antígeno de tipo Inmunológico

Las pruebas de antígeno generalmente brindan resultados que diagnostican una infección por coronavirus activa más rápido que las pruebas moleculares, pero las pruebas de antígeno tienen una mayor probabilidad de fallar ante una infección activa. Si una prueba de antígeno muestra un resultado negativo, esto podría indicar con un % de fiabilidad reducido que usted no tiene una infección por coronavirus activa, su médico podría indicarle en otro momento que se realice otra prueba para verificación.

2 b.) Pruebas de anticuerpos de tipo Inmunológico

Las pruebas de anticuerpos solo detectan anticuerpos que el sistema inmunitario desarrolla en respuesta al virus, no detectan el virus en sí mismo, por lo tanto, es posible que los anticuerpos,  aún no se hayan desarrollado o que que ya hayan desaparecido.    Después de que una persona tuvo la enfermedad pueden pasar varios días y hasta  semanas par que el organismo desarrolle  suficientes niveles de anticuerpos para ser detectados en una prueba. Este tipo de pruebas no son tan utilizadas.

3.) Pruebas Rápidas

Pruebas de Flujo Lateral / Inmunocromatografía coloidal  

Los ensayos de flujo lateral inmunocromatográfico se han denominado comúnmente “Test rápidos” en los medios de comunicación, ya que actualmente se utilizan para detectar antígenos tambien en los  hisopados, PERO tambien las hay que idenyifican anticuerpos contra la enfermedad en la sangre del .   Estas pruebas detectan si la persona estuvo ó está infectada en la actualidad , no tienen tanta sensibilidad como las pruebas cuantitativas PERO son muy utilizadas en encuestas serológicas donde se quiere conocer si una población estuvo o ha estado en contacto con el virus.

Estas pruebas han permitido saber que la inmunidad por este virus en algunos casos desaparece en pocos meses.   Las pruebas rápidas de antígenos en hisopado nasal son poco utilizadas .

Antes de abordar un avión es posible que nos hagan una de estas pruebas

Por el contrario,  las pruebas de anticuerpos de éste tipo SI SON MUY UTILIZADAS, y recientemente se habla de realizarla a los viajeros en aviones o barcos antes de desembarcar .

Son pruebas del tipo de  los inmunoensayos de flujo lateral. Utilizan  dispositivos simples para detectar esos anticuerpos en muestras sanguíneas. El Personal de salud o toma una pequeña muestra de sangre del paciente y la deja caer sobre una esponja dentro del dispositivo. A continuación, se agregan unas gotas de  un reactivo que ayudan a que la muestra de sangre fluya a través del dispositivo.

A medida que la muestra se mueve a través de la tabletita, los anticuerpos contra el SARS-CoV-2 que están presentes en la muestra aparecerán como indicadores  en las líneas de prueba y control. Este proceso se observa como un cambio de color a lo largo de las líneas de control y en los indicadores IgG e IgM que puede verse a simple vista, produciendo una, dos o tres líneas dependiendo del tipo de anticuerpos presentes (IgM o IgG).   Si la prueba muestra igG positivo indica que usted estuvo en contacto con el virus, pero no lo tiene actualmente, or el contrario un IgM positivo indica que las persona tiene en ese momento la infección.

Elementos epidemiológicos importantes a considerar a la hora de elegir el tipo de Prueba:

Acá entran en juego un conjunto de valores tales como el periodo de incubación el periodo de debilitamiento del virus y la convalecencia. En el gráfico de abajo se pueden ver  como los diferentes tipos de test tienen mas utilidad en unas etapas u otras del proceso de la enfermedad.

 

 

 

 

Ciencia de datos y COVID19 – Los test diagnósticos – Importancia las pruebas

 

Son en realidad las pruebas o test importantes como herramienta para administrar la pandemia junto con otros elementos ?

Hagan test, hagan test, test, test:   ha repetido sin cesar el 16 de marzo el director general de la Organización Mundial de la Salud (OMS) Tedros Adhanom Ghebreyesus. Al 13 de marzo, ya la OMS ya había  enviado casi 1,5 millones de test a 120 países. Hoy ( 27-6-2020 yase han realizado segun la OMS cientosde millones de priuebas )  La pandemia del coronavirus nos ha llevado a tomar numerosas medidas para aumentar la distancia social para aplanar la curva de contagio y que el sistema sanitario no colapse.   Otra estrategias paralela que hemos mencionado en otro articulo se refiere al control y monitoreo del Indicador R0.

“La forma más efectiva de prevenir las infecciones y salvar vidas es romper la cadena de transmisión ( lo que las autoridades sanitarias en CR llaman la trasmisión comunitaria ) .

Como romper esa cadena de trasmisión ?

Para esto hay que hacer test para identificar asintomáticos y sintomáticos leves.  No se puede detener el virus sin saber quién está infectado.

“Si un paciete da positivo en una pruebna debne ailarse y  averigüar  con quién ha estado en contacto cercano hasta 2 días antes de que desarrollaran los síntomas.  Hay que hacer test a los contactos  también”,  ha pedido  tambien el director general de la OMS a los distintos países. La OMS considera esencial hacer test pero recomendaba al inicio  hacer test sólo a los contactos de las personas que tienen COVID-19 sí tienen síntomas de la enfermedad.  hoy esa práctica ha variado y los países realizan pruebas masivas a la población.  Veamos los países que mas pruebas han realizado y cuanto significa ese dato en términos del ndicador

Pruebas por cada millón de habitantes

Solo este grupo de países han realizado mas de 200 millones de pruebas a sus habitantes (coumna total tests)  lo que les ha permitido tener un mejor manejo de su pandemia como veremos mas adelante.

 

 

Costa Rica en este mismo “ranking” de Worldometer tiene un total de 7.559 por cada millón de habitantes.  Actualmente el indicador mas utilizado es el de pruebas realizadas por día y no este total de pruebas históricas.

 

Una enorme frustración con los datos

Ningún país conoce con certeza el número total de personas infectadas con COVID-19. Todo lo que sabemos es el estado de infección de aquellos a los que les han  hecho pruebas. En todas las estadísticas mundiales sólo figuran aquellos casos con una infección confirmada por un test de laboratorio, y son los que se denominan y  se cuentan como casos confirmados .  Sólo para  que tengamos una idea del subregistro de casos considerando como ejemplo el caso de España. España reporta  oficialmente 294.985 casos confirmados con una prueba PCR  al 27-6-2020 , pero en la encuesta serólogica recién finalizada se sabe que un 5% en promedio de personas en España tienen algún grado de inmunidad esto implica que al menos 2.45 millones de personas han tenido la enfermedad y que por tanto el sistema tiene un subregistro  del 88%.  En el caso de Costa Rica donde reportan un total de 2.836 utilizando el modelo de Tomas Pueyo,  podríamos decir que en realidad tenemos  alrededor de 28.360 casos  ( esto también implica para nosotros que nuestro sub-registro es cercano al 90% o mas )

Sin pruebas reales no hay datos reales

Tenemos que entender que los recuentos de casos confirmados dependen de cuántas  pruebas realmente ha hecho el país .

Las pruebas son  nuestra ventana a la pandemia y nos permite ver cómo se está propagando. Sin datos sobre quién está infectado, no tenemos forma de entender , ni de atender la pandemia.   Para efectos comparativos tampoco podemos ver qué países están teniendo buenos resultados y cuáles no están reportando adecuadamente casos y muertes. En esto puede ayudar la Ciencia de datos COVID19 – Los test diagnósticos –

Tomando los países mas representativos América en ésta Pandemia por su número de casos y por su cercanía con nosotros  junto con los países que a nivel global han tenido mas casos,  quise hacer este gráfico donde represento el total de casos reportados por millón de habitantes con:    linea verde oscura  y con la linea roja el total de pruebas por millón de habitantes.

 

 

Gráfica comparativa del total de casos nuevos por día de COVID19 en diversos países y la tasa de pruebas realizadas por cada millón de habitantes. Este análisis fué realizado con Anaconda Navigator, Jupyter Notebooks y las ibrerías: pandas, seaborn, scipy, numpy, six  y mathplotlib entre algunas otras. El módulo de predicciones fue desarrollado con el algoritmo de ensamble XG-BOOST de inteligencia artificial.  El lenguaje de desarrollo es Python. Las fuente de datos es Wordindata.info y Johns Hopkins University.

 

 

 

Análisis Descriptivo (conclusión) : Ciencia de datos y COVID19 – Los test diagnósticos –

Cada país tiene sus particularidades y una serie de fenómenos que analizaré en próximas publicaciones  pero que en su conjunto nos pueden indicar, que los paises  mas exitosos en la atención de la Pandemia, su estrategia consiste como insiste el Ministro de Salud de Costa Rica Daniel Salas,  en una vigilancia estrecha de los casos, con ayuda de las pruebas.

Si tenemos todavía mas pruebas sin duda  mejorará  la vigilancia epidemiológica.     La estrategia del martillo y  la danza es el marco estratégico que el Gobierno de Costa Rica se ha planteado.  En mis artyiculos previos sobre covid he analizado los modelos de Pueyo a profundidad

Tomemos el caso de Canadá, Dinamarca,  Australia y Polonia, los que tienen en común un aplanamiento de sus curvas ,  ( obvio que con un saldo no tan alto del número de fallecidos ), como Bélgica, Francia,o España  lo que indica que NO HAY QUE LLEGAR A TENER MUCHOS MUERTOS PARA ESTABLECER UN BUEN CONTROL. Yo esperaría que fuese el caso de Costa Rica.

Los que lo hicieron mejor y los que tenemos que mejorar

Todos ellos,  cuando empezaron a bajar la curva estaban realizando entre 20 y 25.000 pruebas por millón.  Muchos de ellos actualmente están  entre 40.000 y  90.000 hasta 150.000 pruebas por millón.  Cota Rica llega a apenas a 7.500

Por el contrario,  los países como nosotros que vamos  en una curva ascendente: Colombia, México, Perú, Panamá, Argentina, India, Bolivia y Costa Rica   tenemos en común cantidades de pruebas de apenas entre 5000  y 7000  por millón, ashi esta el riesgo de conducir el vehiculo con los ojos cerrados o muy poco abiertos.

Hay casos que se salen del grupo como los EEUU o El Salvador con valores de 90.000 por cada millón y con una curva que sigue en ascenso, o Irán donde aparentemente se tomó la decisión tarde .  Cada uno de ellos habría que analizarlas con mayor detenimiento.

Que tienen en común  éste  primer grupo de países en su abordaje ante la Pandemia ?

Hicieron muchas pruebas a la población,  lo que les “aplano” o martilló  la curva sin necesidad de llegar a muchas muertes como el caso de: Francia España, Italia y Bélgica que también la aplanaron pero con un saldo importante de muertes !

 

Que tenemos en común  éste  segundo grupo de países en nuestro abordaje ante la Pandemia ?

Que todos vamos en curva ascendente y nuestra cantidad de  pruebas llega apenas a  5000 -7000 pruebas por millón de habitantes o menos.

 

 

Agradezco que se hayan tomado el tiempo para leer este artículo y que reflexionen sobre la importanciade las medidas obligatorias antes esta Pandemia mientras nos llega la vacuna.

 

Covid-19: Mascarillas, guantes, protocolos y restricciones ...

 

 

 

Nota:

Se agradece la ayuda y participación del   Dr. Álvaro Salas Chaves**

* El autor de Ciencia de datos y COVID19 – Los test diagnósticos – es informático médico, máster en Business Intelligence y especialista en BIG DATA y Ciencia de Datos, aplica modelos de Machine Learning y de Inteligencia Artificial en el campo de la salud. Actualmente reside en Barcelona y colabora en la cátedra de Informática Médica de la Universidad de Barcelona, como profesor visitante.

 

**  Dr. Alvaro Salas Chaves, médico cirujano, graduado de la Universidad de Costa Rica, especialista en administración y planificación de Servicios de Salud de la Universidad de Leeds, Reino UNIDO; especialista en economía de la salud de la Universidad de Harvard, USA. Director de clínicas y hospitales de la CCSS y presidente ejecutivo de la misma en los años 1994-1998 , es  Profesor de Gestión de Servicios de Salud, Universidad de Costa Rica.

Saludos,  de parte el equipo de: Ciencia de datos y COVID19 – Los test diagnósticos –Health BIG DATA en la elaboración de 

 

 

 

 

 

 

 

 

 

 

3 Responses

  1. José Luis Bermúdez dice:

    Excelente trabajo… Realmente muy bien fundamentado

  2. Jose Manuel Macaya Fernandez dice:

    Muy interesante su articulo. Usualmente estas cosas las escriben personas que no pertenecen al sector y terminan con muchos sesgos Como obtuvo las relaciones entre las variables ?

    • Juan Ignacio Barrios Arce dice:

      En ciencia de datos, se sigue una linea de trabajo y eso arranca primero por hacer un mapa de estudios similares en donde usted eventualmente pueda apoyarse para comprobar o rechazar su hipótesis ( obviamente que se consideran estudios que incorporen Evidencia científica) y en este caso específico hay muchos estudios. Luego pasamos analizar el set de datos, para ver si existen relaciones entre variables, y así poder decidir mejor nuestro plan de trabajo (el hecho de que no existan tampoco invalida, solo te complica un poco) . Luego procedemos, si fuese necesario, a transformar variables y todo lo necesario antes de llegar a la etapa de la minería de datos. Si vamos bien hasta aquí podemos realizar los análisis, ver como lo visualizamos y finalmente cómo lo interpretamos, contando para ello con las herramientas y técnicas adecuadas etc. He escrito varios post sobre cada una de estas etapas, por si quiere profundizar ). En este caso en particular: Yo siempre arranco con hago un análisis básico utilizando el Coeficiente de correlación (Pearson) entre las variables porque de ésta forma me oriento, acá te das cuentas si las relaciones son funcionales o si hay relaciones estadísticas (estocásticas). El análisis de la covarianza (valor de r ) en este caso es claramente positivo. (ver gráfica adjunta) , si uno quiere profundizar sobre ese análisis de correlación puede hacer una gráfica de dispersión y poder clasificar esa relación en: (positiva, negativa, funcional, estocástica, fuerte, débil, etc.) aunque ya como podes ver en el gráfico de correlación (heat Map) te habla de una fuerte relación. Para concluir: si uno, no se siente del todo satisfecho, puede aplicar el teorema de Bayes que ahora está muy de moda en salud, porque además nos orienta si la relación es de A—->B o de B —>A, etc. No es lo mismo decir: que los resfrios dan dolor de cabeza a que cuando te duele la cabeza = estás resfriado … Agradezco mucho de que se haya tomado la molestia de leer mi POST y tambien le agradezco sus comentarios que me permiten sin duda mejorar en mi trabajo !
      Ahora bien, acá llegamos a lo que quiero llegar como conclusión. En la actualidad ya no descartamos variables “no relacionadas” ya que cuando profundizamos en nuestros análisis con los algoritmos de IA, vamos observando la complejidad de la “multidimensionalidad”. Porqué tiene relevancia ? Porque vemos que esas relaciones se potencian cuando hay otras variables que están relacionadas de forma “oculta” por ejemplo: la mortalidad es mas alta en covid19 en pacientes con enfermedades previas: cuando tienen 1 enfermedad hasta un 20%, pero si tiene 2 un 30% y si tiene 3 o mas hasta un 50%, y eso varía de acuerdo a los tipos de enfermedad y varía de acuerdo a la edad, y varia de acuerdo a la cepa del virus, y al sexo, y al tipo de sangre, y es de no terminar……. Es posible que al inicio no encontremos relación entre las variables, pero cuando se analizan juntas 2, 3 o más esa relación se potencia…. Discúlpeme por mi larga respuesta, pero éste tema del “feature engineering” o ingeniería de las variables es infinito y por demás apasionante.
      Coeficiente de correlación entre las variables

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *