Instituto de Ciencias

ici

Novedades ICI

Instituto de Ciencias

ici

Novedades ICI

Novedades ICI

Lunes 20 de julio de 2020

Ni meseta ni patada en los dientes: el error de no considerar el error

En esta nota, el biólogo Fernando Momo, investigador docente y secretario de Investigación el Instituto de Ciencias de la UNGS y uno de los coordinadores de la red covid-19 UNGS, habla sobre el análisis y la interpretación de datos relacionados a la cantidad de contagios por covid-19.

En vísperas de los inminentes anuncios de relajación del aislamiento/distanciamiento social obligatorio hemos visto nuevamente en los medios informativos, tanto por parte de periodistas como de profesionales de la salud, una discusión en torno a la supuesta estabilización del número de contagios contrapuesta a una, también supuesta, nueva aceleración. Señales de alarma sobre “el peor momento” de los contagios, suposiciones sobre el “aplanamiento de la curva” y razonamientos en torno a un R cercano a 1.

La verdad es que para poder discutir en torno a los nuevos casos diarios que se suman hay que tomar en cuenta que ese número involucra múltiples fuentes de error y fluctuación y sus variaciones día por día no nos dicen mucho de posibles tendencias.

Error de los datos y fuentes de variación Si observamos el aumento de los casos diagnosticados por día a lo largo de todo el proceso de la epidemia, notaremos que todo el tiempo existen fluctuaciones aunque el número promedio va en aumento:

Ambas cosas son lógicas. Es lógico que el número de infectados diarios crezca porque hay más casos activos y asintomáticos, más circulación del virus y por lo tanto más contagios. Esto es lo que se intenta controlar con las medidas de distanciamiento. También es lógico que los números oscilen porque el proceso de transmisión de la enfermedad no es constante, hay factores de azar que influyen en el contagio, tampoco el proceso de detección es constante y exacto, se acumulan isopados y se completan los reportes de los positivos con una cierta demora. Todo eso introduce fluctuaciones en los datos. Entonces, la pregunta es ¿indican esas variaciones algo más que el error casual?

Podemos hacer un sencillo ejercicio estadístico y explorar la distribución de esos errores. Si asumimos que el tiempo que transcurre entre el contagio y la detección y reporte es de alrededor de 10 días, podríamos ver cómo fue variando la relación (el cociente) entre el número diario de nuevos casos y el número de casos activos de diez días antes; esto sería una estimación muy burda de la proporción de contagios. Si hacemos esto para todo el período desde el inicio de la epidemia veremos que ese cociente tiende a estabilizarse:

Al principio los valores son muy altos porque había muy pocos detectados y se daban muchos contagios proporcionalmente. Miremos ahora con “lupa” lo que pasa con estos valores a partir del 20 de abril, graficando sólo la segunda parte de estos datos:

Lo que vemos aquí es que los valores de la proporción entre los casos diarios reportados y el número de infectados activos diez días antes se mantuvieron fluctuando alrededor de un valor promedio más o menos constante (representado por la línea de rayas). En el gráfico, las líneas de puntos pequeños marcan los límites superior e inferior obtenidos sumando y restando respectivamente al promedio una cantidad igual a dos veces la desviación estándar de los datos. Se supone que esa “franja” debe contener alrededor del 96 % de los datos. Podemos ver que en los últimos días las fluctuaciones se han mantenido dentro de la variación esperable. Si queremos ver mejor esas variaciones podemos hacerlo en el siguiente gráfico:

Las disminuciones y los aumentos del número diario de casos nuevos reportados son variaciones que se pueden atribuir al azar. No podemos obtener de ellas conclusiones razonables y confiables acerca de si hay “amesetamiento” de la curva o “un súbito aumento”.

Para tratar de hacer predicciones sobre eso hay que utilizar otras herramientas estadísticas un poco más robustas y también un poco más complejas.

Las conclusiones de esto son muy simples: todo lo que medimos tiene errores, para saber qué está pasando con el fenómeno hay que mirar el conjunto de los datos, no el día a día. Mirar los casos día por día y tranquilizarse cuando hoy hay menos contagios que ayer y desesperarse cuando mañana haya más que hoy es como caer en aquel viejo chiste que preguntaba si andaba el guiño del auto y el que miraba contestaba “ahora sí, ahora no, ahora sí…”.

Por Fernando Momo
Instituto de Ciencias - UNGS

Seguinos en