jueves, 27 de agosto de 2020

Manipulación de datos y segunda ola de la pandemia


Casos declarados durante el mes de mayo de 2020 en España
Fecha
España
Italia
Nuevos
Acumulados
Diferencia
Nuevos
Acumulados
Diferencia
 1/5
1175
215216

1872
205463

 2/5
1147
216582
1366
1965
207428
1965
 3/5
838
217466
884
1900
209328
1900
 4/5
356
218011
545
1389
210717
1389
 5/5
867
219329
1318
1221
211938
1221
 6/5
685
220325
996
1075
213013
1075
 7/5
754
221447
1122
1444
214457
1444
 8/5
1095
222857
1410
1401
215858
1401
 9/5
604
223578
721
1327
217185
1327
10/5
621
224390
812
1083
218268
1083
11/5
373
227436
3046
802
219070
802
12/5
426
228030
594
744
219814
744
13/5
439
228691
661
1402
221216
1402
14/5
506
229540
849
888
222104
888
15/5
539
230698
1158
789
223885
1781*
16/5
421
231350
652
875
224760
875
18/5
285
231606
256*
675
225435
675
19/5
295
232037
431
451
225886
451
20/5
416
232555
518
813
226699
813
21/5
344
233037
482
665
227364
665
22/5
446
234824
787
642
228006
642
23/5
361
235290
466
652
228658
652
24/5
246
235772
482
669
229327
669
25/5
132
235400
-372*
531
229858
531
26/5
194
236259
859
300
230158
300
27/5
231
236769
510
397
230555
397
28/5
182
237906
1137
584
231139
584
29/5
187
238564
658
593
231732
593
30/5
271
239228
664
516
232248
516
31/5
96
239429
201
416
232664
416

Se observará que Italia, al igual que la mayor parte de los países del mundo, considera casos nuevos los que se detectan cada día, por lo que la diferencia entre el valor acumulado de un día y el anterior coincide (casi) siempre con el número de casos nuevos, excepto en una fecha (15/5), en que se realizó un reajuste de datos.
Al principio, también el Gobierno de España proporcionaba así los datos, pero a partir de la segunda mitad del mes de abril cambiaron el criterio, distribuyendo los casos nuevos de cada día entre varios días anteriores, aduciendo que cada caso debía corresponder, no al día en que se detectaba, sino al día en que se realizó la prueba.
¿Por qué se aplicó ese criterio, (casi) único en el mundo, que por cierto dejó inservibles la mayor parte de los modelos matemáticos desarrollados durante la pandemia? No se me ocurren más que dos motivos: disimular el número de casos nuevos, haciéndolo parecer menor de lo que era; y dificultar las comparaciones con otros países. Quizá haya alguna otra razón, pero yo no soy consciente de ella, ni por qué somos el único país del mundo (que yo sepa) que lo hace así. Lamentablemente, los medios de comunicación suelen poner énfasis en el número oficial de casos nuevos declarados, y a veces no se molestan en restar los acumulados de cada día de los del día anterior, lo que proporciona un valor mucho más fiable. Así se solía decir que estábamos por debajo de 200 (o por debajo de 100) casos diarios, cuando el número real era mucho más alto (véase, por ejemplo, el 28 de mayo).
En la tabla anterior aparecen varios días señalados con un asterisco. Son días en los que la diferencia entre el número de casos acumulados presenta discrepancias, tales como ser menor que el número de casos nuevos declarados (18/5), o incluso negativo (25/5). Estas discrepancias están en los datos oficiales, y en su día se atribuyeron a reajustes de datos necesarios por la acumulación de errores en días anteriores.
Casos declarados durante parte de la llamada segunda ola de la pandemia en España:
Fecha
Casos nuevos
Acumulados
Diferencia
13/7/20
263
256619
666
14/7/20
390
257494
875
15/7/20
580
258855
1361
16/7/20
628
260255
1400
19/7/20
685
264836
4581*
20/7/20
529
266194
1358
21/7/20
730
267551
1357
22/7/20
971
270166
2615
23/7/20
922
272421
2255
26/7/20
855
278782
6361*
27/7/20
905
280610
1828
28/7/20
1153
282641
2031
29/7/20
1229
285430
2789
30/7/20
1525
288522
3092
2/8/20
968
297054
8532*
3/8/20
1178
302814
5760
4/8/20
1772
305767
2953
5/8/20
1683
309855
4088
6/8/20
1895
314362
4507
Los asteriscos en esta tabla señalan días en los que el valor acumulado subió muy por encima de lo normal, debido a que en este mes el Ministerio dejó de presentar datos los fines de semana, por lo que los datos de tres días se acumulan en el lunes. En cualquier caso, puede verse que el número de casos nuevos diarios fue siempre muy superior al de casos nuevos declarados con el sistema de manipulación estadística adoptado por el Gobierno, pues cuando los medios nos decían que el número de casos nuevos se aproximaba a 1000 al día, en realidad andaba por encima de 2000, e incluso algún día pasó de 5000.
A la hora de comparar estos datos con los de la primera ola de la pandemia, hay que tener en cuenta que los datos actuales incluyen muchos casos asintomáticos (más de un 50%), que prácticamente brillan por su ausencia en los datos de marzo y la primera mitad de abril. Eso explica también, al menos en parte, por qué ha disminuido últimamente la tasa de fallecimientos. Lo que es vergonzoso es que el Ministerio de Sanidad siga dando 28.838 como cifra acumulada de fallecidos a fecha 25 de agosto, cuando el MoMo (datos del Centro Nacional de Epidemiología) daba el 24 de agosto una cifra mucho más fiable, 46.096, obtenida sumando los 43.556 de la primera ola, y los 2.540 de la segunda, que según sus datos dio comienzo el 27 de julio.
Hilo temático sobre lingüística y medicina: Anterior Siguiente

Manuel Alfonseca

14 comentarios:

  1. Totalmente de acuerdo con el análisis. El motivo del cambio de criterio lo tendrán que explicar, y también algunas cosas más que creo están relacionadas y enumero:
    - ¿Porqué no se ofrecieron las series de datos con ambas fechas?. Está todo en una base de datos, sería trivial hacerlo automáticamente y publicarlas en un formato estándar, de forma que podamos compararnos fácilmente con otros países.
    - ¿Porqué ni siquiera se ponen de acuerdo cuál es la fecha de los casos? Sanidad, como bien indicas, usa ahora la fecha de muestra en el informe diario, sin embargo, en los CSV con los datos, que publica el ISCIII, usan la fecha de inicio de síntomas, incluso para asintomáticos!!!
    - ¿Porqué se eliminó la serie de recuperados?. Para calcular el índice de fatalidad por caso (CFR) no se pueden contar como casos los no resueltos, y sin datos individualizados la mejor forma es dividiendo fallecidos por (fallecidos + recuperados). Claro, que así saldría un valor mucho mayor que el publicado durante la pandemia, y no podríamos presumir de un CFR anormalmente bajo.
    - Lo mismo se podría decir de las series de hospitalizados y UCI, que en la primera ola se publicaban en PDFs y CSV, y con la "mejora del sistema" se eliminaron de los CSV. Incluso en los PDFs estas series estuvieron mostrando durante muchas semanas valores mucho menores que si se sumaban los que publicaban las comunidades autónomas. Lo sabían, y sin embargo no lo reconocieron hasta que un periodista preguntó en rueda de prensa. Esa rueda de prensa no la dio Fernando Simón, que estaba de vacaciones, y fue la primera en la que dieron la diferencia de casos acumulados, en lugar del dato de los casos de las últimas 24 horas que les había dado tiempo a tener el resultado en las mismas 24 horas...

    Siento haberme extendido tanto con el comentario, pero es que la cantidad de problemas con la información que nos dan es tan abultada y persistente en el tiempo, que es difícil creer que sean accidentales.

    ResponderEliminar
  2. https://amp.20minutos.es/noticia/4364036/0/elon-musk-nuevos-avances-sobre-neuralink-chip-implanta-craneo/ que opina de esta noticia?, a mi lo de almacenar recuerdos me parece exagerado

    ResponderEliminar
    Respuestas
    1. La noticia dice: "el chip permitiría..." o sea, que no es algo que se haya logrado. Lo de los recuerdos, en efecto, está exagerado, porque aún no sabemos cómo los almacena el cerebro.

      Ya se sabe que la prensa diaria lo único que quiere es noticias sensacionalistas. La página de la Wikipedia al respecto está más equilibrada:
      En español: https://es.wikipedia.org/wiki/Neuralink
      En inglés: https://en.wikipedia.org/wiki/Neuralink

      Eliminar
  3. Del exceso de verano hay que restar los de las olas de calor, también medidos por el Momo. Y lo mismo del exceso de primavera: no todo es Covid, ni de coña. Y el que diga que los 43.000 muertos fueron de Covid tiene que demostrarlo.

    ResponderEliminar
    Respuestas
    1. ¿Ha visto usted los gráficos del MoMo? Lo que hace es comparar las muertes previstas con las reales. Olas de calor y otros fenómenos están incluidos en las muertes previstas. Y en las condiciones en que hemos estado, la interpretación más probable es que todo el exceso es debido a la Covid. El que diga que los 43.000 muertos no fueron de la Covid tiene que demostrarlo. Veo que usted es negacionista, en otro sentido del término.

      Eliminar
  4. https://www.google.com/amp/s/amp.20minutos.es/noticia/4150326/0/estudio-monos-podria-servir-despertar-personas-coma/ acaba de salir esta noticia hoy en la cope , una duda ,esto tiene algo que ver el monismo materialista o nada que ver ? Lo pregunto por lo de que al activar zonas del cerebro a esos monos se despertaban y al volverlas a estimular se volvian a dormir.

    ResponderEliminar
    Respuestas
    1. No confunda los hechos con las teorías filosóficas que tratan de explicarlos. Esta noticia se refiere a un experimento concreto y no tiene nada que ver ni con el monismo materialista, ni con ninguna otra teoría, cualquiera de las cuales le dará una explicación diferente.

      Por cierto, en la frase "Estudios anteriores ya habían investigado las áreas del cerebro relacionadas con la consciencia, sin embargo, esta es la primera investigación que logra mostrar de manera práctica la relación" la palabra "consciencia" debe interpretarse en el sentido de "estar consciente o inconsciente", no en el sentido de la auto-consciencia, con la que esta noticia no tiene nada que ver.

      Eliminar
  5. Ok muchas gracias por las aclaraciones como otras veces, espero que tenga un buen dia

    ResponderEliminar
  6. Buenos dias, me podria mencionar libros o neurocientificos que no sean reduccionistas? hay actualmente neurocientificos dualistas?

    ResponderEliminar
    Respuestas
    1. Sobre esto tengo previsto publicar un artículo en este blog durante el mes de octubre. Espero que no le importe esperar hasta entonces.

      Eliminar
  7. Ok esperare y lo leere con interes no hay problema, que tenga un buen dia

    ResponderEliminar
  8. http://frasesdedios.blogspot.com/2013/09/la-singularidad-del-ser-humano.html?m=1 ya jhon eccles mencionaba su decepcion por el cientifismo reduccionismo etc

    ResponderEliminar

Por favor, no ponga Anónimo o Unknown como origen del comentario. Ponga cualquier nombre, o al menos diga dentro del texto de quién se trata (no tiene que ser su nombre y apellidos). Si todos pusieran Anónimo o Unknown, no sabría si estoy hablando con una persona o con varias.

Sea lo más conciso que le sea posible. Los comentarios no deben competir en longitud con el artículo.

Aunque este blog está preferentemente dirigido a la divulgación de la ciencia, es inevitable que mis ideas influyan en mis artículos. Si a algún lector le molestan mis ideas hasta el punto de no poder mantener la calma, le recomiendo que deje de leerme. Pero si se empeña en discutirlas, exijo respeto, y que se evite la falacia ad hominem. De lo contrario, el comentario no será publicado.