Datenprobleme
Auf Grund von Fehlern in der Übermittlungskette:
- Ein Land meldet für einen Tag keine neuen Fälle. In diesem Fall kann
- die Berechnung nicht durchgeführt werden, weil der Nenner 0 wird oder
- der Zähler wird 0, dann wird der gesamte Bruch 0
- Ein Land meldet für einen Tag nur wenige neue Fälle. Dann wird entweder
- der Zähler klein bei großem Nenner und das Ergebnis disproportional klein oder umgekehrt:
- der Zähler ist groß und wird im Vergleich zu anderen Tagen durch einen kleinen Nenner überproportional groß
- Ein Land meldet kumuliert sehr viele Fälle auf einmal nach
Beispiel England
Wie sich solche Situationen auf den Kurvenverlauf auswirken ist in folgendem Bild am Beispiel Englands dargestellt. Eine Beschreibung der Maßnahmen, wie solche Probleme kompensiert werden können, ist darunter beschrieben.
Die schwarze gestrichelte Linie zeigt den Verlauf des R-Wertes unter Verwendung der Originaldaten: An den Tagen 37, 39, 51, 54 und 58 wird die Kurve 0 und zeigt damit einen R-Wert von 0 an. Für die Tage 43, 45 und 62 wird ein sehr großer R-Wert berechnet.
Die grüne Kurve zeigt ein so genanntes gleitendes Mittel über sieben Tage, das für den R- Wert berechnet wurde. Gleitendes Mittel bedeutet, dass man die Summe der Werte über (in diesem Fall) sieben aufeinander folgende Tage bildet und den Wert durch sieben teilt. Der rechteckige Anstieg ab Tag 62 ergibt sich aus dem Mittel über sieben Tage, wobei der große Wert bei Tag 62 selbst bei der Mittelwertberechnung noch deutlich durchschlägt.
Um die Abhängigkeit der Berechnung von der schwankenden Mitteilung von Fällen zu reduzieren, wird vor der Berechnung des R-Wertes das gleitende Mittel über die Anzahl der gemeldeten Fälle berechnet und erst dann der R-Wert bezogen auf die gleitenden Mittelwerte kalkuliert, rote Kurve.
Die blaue Kurve zeigt dann noch die über ein gleitendes Mittel geglättete rote Kurve.
Beispiel Frankreich
Die Fallzahlen Frankreichs zeigen besondere Ausreißer. So wurden z.B: am 12.04.2020 fast 25.000 neue Fälle gegenüber dem 11.04.2020 gemeldet, was einem Zuwach von mehr als 25 % an einem einzigen Tag entspricht. Am 18.04.2020 wurde der gleiche Wert berichtet, wie am Vortag. In diesem Fall kann man den R-Wert (vier Tage später) nicht ebrechnen, da der Nenner null würde. Am 22.04.2020 wurde die Zahl der bekannten Fälle sogar nach unten korrigiert, was zu so merkwürdigen Auswirkungen, wie einem negativen Reproduktionsfaktor führt.
Schlussfolgerung
Bei der Berechnung des R-Faktors verwende ich daher ab dem 27.04.2020 die Darstellung, die der blauen Kurve in den oberen beiden Darstellungen entspricht: das gleitende 7-Tage Mittel für den R4-Wert basierend auf dem gleitenden 7-Tage Mittel der Falldaten.