Am 01.11.2020 publizierte ich eine erste von mehreren Prognosen zur Entwicklung der Zahl an Neuinfizierten pro Tag, unmittelbar vor Inkrafttreten des neuen Lockdowns. Seit dem 23.11.2020 habe ich die Prognose auf Basis einer modifizierten Gaußschen Glockenfunktion umgestellt, die mit einer Sinusfunktion überlagern wurde, um wöchentliche Schwankungen der täglichen Fallzahlen berücksichtigen zu können.
Über den Vergleich des Kurvenverlaufs mit den täglichen Zahlen an Neuinfektionen war besonders auffällig, dass an den Tagen t_{301} - t_{303} (17.11.-19.11.2020, KW 47) drei aufeinanderfolgende Werte über der Kurve liegen. Eine Häufung von Abweichungen in nur eine Richtung war sonst nicht beobachtet worden. Ich lehnte mich aus dem Fenster und behauptet, dass die am heutigen Donnerstag, 26.11.2020, zu veröffentlichenden Testzahlen zur KW 47 über dem der Vorwoche (KW 46) liegen wird.
Ich habe mich geirrt. Die folgende Tabelle zeigt, dass die Prognose um fast 6.000 niedriger war als die realen Zahlen. Die Abweichung zum Vortag bleibt bei 26%.
23.11. | 24.11. | 25.11 | 26.11. | 27.11. | |
Prognose | 11.500 | 13.800 | 16.500 | 17.000 | 15.000 |
Ist | 13.554 | 18.633 | 22.268 | ||
Differenz | -2.054 | -4.833 | -5.768 | ||
Diff. [%] | -15,1% | -26% | -26% |
Die folgenden beiden Abbildungen zeigen den Verlauf der Zahl täglicher Neuinfektionen sowie die Approximationen. Die erste Abbildung zeigt neben dem Verlauf der täglichen Zahl an Neuinfektionen auch ein gleitendes Mittel über 7 Tage (schwarze Quadrate). Die durhgezogene Linie zeigt die Approximation übe reine modifizierte GAusssche Glockenfunktion. Das gleitende Mittel über die Zahl der Neuinfektionen verläuft seit circa drei Wochen horizontal, d.h., der Wert bleibt in etwa konstant, die Zahlen steigen weder noch fallen sie. Für die letzten drei dargestellten Werte ist eine nach oben zunehmende Abweichung von der approximierten Kurve zu erkennen.
Zum besseren Vergleich der Werte und der approximierten Kurve zeigt die folgende Abbildung eine Vergrößerung um den aktuellen Tag. Die besser aufgelöste Darstellung zeigt, wie der Abstand der realen Werte (schwarze Kreuze) zur Kurve in den letzten drei Tagen immer größer wird. Im Vergleich zur letzten Prognose ist außerdem festzustellen, dass der Tag des Maximum sich um einen Tag nach rechts verschoben hat von t_{295} zu t_{296} (s. Abb. oben).
Wie schon an diversen anderen Stellen erwähnt, verwende ich die Prognosen vor allem, um Abweichungen der realen Werte zur Prognose zu erkennen. Ich unterstelle, dass bis zur Erstellung der Prognose eine Kombination aus unbekannten aber stabilen Parametern den Verlauf der Kurve erklären. Die Vermutung: Weichen die realen Zahlen von der Prognose über einen längeren Zeitraum ab, hat sich irgendetwas geändert. Eine kurze Suche ergab folgenden Fund auf den Seiten des RKI:
Veränderte Testkriterien
Am 03.11.2020 (t_{287}) wurden die Testkriterien geändert. Die Änderung der Testkriterien erfolgte genau einen Tag nach Inkrafttreten des neuen Lockdowns. Es bleibt unklar, wie schnell die geänderten Vorgaben des RKI von den Gesundheitsämtern umgesetzt werden. Die Kriterien zielen darauf ab, bei der Auswahl zu testender Personen darauf zu achten, dass „ein hinreichendes klinisches Bild vorliegt und/oder ein epidemiologischer Zusammenhang zu einem Infektionsgeschehen oder einer Risikogruppe“ besteht. Medizinische Aspekte werden damit in den Vordergrund gerückt. Es genügt nicht mehr nur, dass man Rückkehrer aus einem Risikogebiet ist, man muss zusätzlich „akute respiratorische Symptome jeder Schwere“ aufzeigen.
Diese veränderten Testkriterien haben mit hoher Wahrscheinlichkeit zur Folge, dass mit weniger Tests mehr Infizierte gefunden werden, d.h., die Zahl täglich festgestellter Neuinfinzierter nimmt zu auf Grund einer gezielteren Selektion der zu testenden Personen! Damit nimmt auch die Positivrate, also der tatsächlich positiv Getesteten, zu. Die publizierten Zahlen in Anbetracht von Veränderungen, die die Messgröße beeinflussen, zu interpretieren, ist hinreichend schwierig. Einen Effekt des Lockdowns auszumachen erst recht. Man wird etwas warten müssen, bis sich die Änderung der Testkriterien in einem über einen längeren Zeitraum stabilen Auswahlverfahren niederschlagen und beobachtete Änderungen in den Zahlen tatsächlich auf ein verändertes Infektionsgeschehen zurückgeführt werden können.
An anderer Stelle habe ich beschrieben, dass es zulässig ist, die Infektionszahlen mit den Testzahlen zu verrechnen. Dies gilt zumindest qualitativ, das bedeutet, man wird durch diese Umrechnung die richtige Größenordnung treffen und nur ein paar Prozent daneben liegen aber nicht um den Faktor 5 oder 10. Der Fehler wird durch die veränderten Testkriterien ebenfalls eher größer als kleiner. Dennoch werde ich im Weiteren nicht nur eine Approximation für die Originaldaten vornehmen sondern auch für die bezüglich der Anzahl durchgeführter Tests angepassten Zahlen. Die beiden folgenden Abbildungen zeigen das Ergebnis:
Die Approximation an die modifizierten Zahlen erscheint besser, die Abweichung der realen Zahlen von der approximierten Kurve sind kleiner. Dies ist allerdings nicht als statistisch gesichert zu verstehen sondern nur als einfache phänomenologische Betrachtung. Es fällt weiterhin auf, dass das Maximum 5 Tage später berechnet wird und der Wert für Sigma ist um 3,5 oder 17% gestiegen. Das bedeutet, dass der asymmetrische Aspekt größer geworden ist: Die Kurve fällt nun noch langsamer als sie angestiegen ist. Auch das Mximum der Kurve ist größer geworden und von 19.393 auf 21.927 oder um knapp 12% gestiegen.