(22) Epidemiologie und Infektiologie – Fallstricke der nackten Zahlen

Als ich Anfang Januar 2020 das erste Mal von der Corona-Krise in der Zeitung las, hieß es: „Schon 34 Menschen sind an der neuen Krankheit verstorben“. „Und jetzt?“ dachte ich. Ist das viel oder wenig? 34 von insgesamt 40 auf einem Boot? Das wäre sehr viel, denn das wären 85%. 34 in einer Stadt mit 12 Millionen Einwohnern? Das wäre sehr wenig, denn das wären 0,00028% oder 28 in 10.000.000.

Man sieht an diesem kleinen Beispiel: Zahlen ohne Kontext machen nur begrenzt Sinn. Mein Kollege, der Mathematiker Thomas Ostermann, hat in einem anderen Blog zum Corona-Thema gezeigt, wie durch mediale Verbreitung falscher Information zum angeblich exponentiellen Wachstum der Sars-CoV-2-Infizierten Angst geschürt wird. Das exponentielle Wachstum hört natürlich irgendwann auf, wenn eine Sättigung erreicht ist.

Und genauso ist es auch, wenn mit nackten Zahlen um sich geworfen wird.

In Italien, konnte man am 2.4.20 lesen, sind 105.792 Covid-19 Fälle gemeldet gewesen, davon 12.430 Tote. Das wäre eine sogenannte Case-Fatality-Rate von 11.7%, also der Anteil der Gestorbenen von den Infizierten. In Deutschland waren es am gleichen Tag 73.522 Infizierte, von denen 872 gestorben sind. Das macht eine Case-Fatality Rate von 1,2% aus. Sie ist also fast um den Faktor 10 kleiner als die in Italien. Woran liegt das? Ist das realistisch?

Wir sehen an diesem kleinen Zahlenbeispiel, dass bei den nackten Zahlen ohne Verhältnis Fallstricke lauern. Zum einen müssten wir eine repräsentative Erhebung von Erkrankten haben: also wissen, wie viele Menschen wirklich infiziert sind oder waren und wie viele von diesen Menschen, die infiziert waren, tatsächlich erkrankt waren. Nur so kann man eine sehr wichtige epidemiologische Kennziffer errechnen, nämlich die Erkrankungsrate. Sie sagt uns, wieviel Prozent einer Bevölkerung tatsächlich erkrankt sind. Und das Verhältnis der Infizierten zu den Kranken sagt uns etwas darüber aus, wie gefährlich eine Infektion ist.

Nehmen wir mal an, eine große Gruppe von Menschen infiziert sich mit einem für das menschliche Immunsystem völlig neuen Erreger, Tollwut zum Beispiel. Dann wird der allergrößte Teil derjenigen, die mit dem Erreger in Berührung kommen, auch krank werden. Das war zum Beispiel so, als die Europäer Schnupfen in die Neue Welt brachten. Die eingeborenen Stämme dort waren diesen für uns Europäer harmlosen Viren völlig schutzlos ausgeliefert und sind reihenweise gestorben. Der Roman „Blackrobe“/“Schwarzrock“ von Brian Moore beschreibt diese historische Episode.

Aber nur die wenigsten Erreger sind für Menschen 100% krankheitserregend. Gegen viele sind wir But only a few pathogens are 100% pathogenic for humans. We have natural immunity to many, acquired immunity to some, and if we don’t have any, then a strong immune system will still fight off some before symptoms occur. Then we will be „positive“ via an immunological test, but not experience any illness. And still other people may become ill before they overcome the pathogen and gain immunity.

Wir müssen also mehrere Kategorien unterscheiden:

  1. Mit dem Erreger nicht in Kontakt gekommen
  2. Mit dem Erreger in Kontakt gekommen, aber ohne weitere Spuren und ohne Krankheitssymptome – immun und Erreger-negativ; allenfalls IgG-Antikörper-positiv, die eine frühere Abwehr des Erregers anzeigen
  3. Mit dem Erreger in Kontakt gekommen, nicht immun, aber ohne Symptome, weil eine rasche Immunreaktion den Erreger wieder eliminiert hat – symptomlos aber Erreger-positiv
  4. Mit dem Erreger in Kontakt gekommen, nicht immun und erkrankt
    • Eine Unterkategorie dieser Menschen sind die, die so schwer erkrankt sind, dass sie an der Krankheit versterben

1) kann davon abhängen, wie infektiös ein Erreger ist oder wie leicht man sich mit ihm anstecken kann. Krankheiten wie Windpocken z.B. sind extrem infektiös und werden rasch überall hin transportiert. Tetanus hingegen bekommt man nur sehr schwer: Man muss schon mit offener Wunde eine halbe Stunde im Pferdemist wühlen oder so, weil der Tetanus-Erreger ein anaerobes Bakterium ist, also nur unter Luftabschluss gedeiht. Diese Kategorie hängt natürlich auch davon ab, welche Maßnahmen gegen Erregerkontakt getroffen werden.

Während der mittelalterlichen Pestseuchen haben manche Städte ihre Tore verschlossen und sind verschont geblieben. Aber selbst hier sind manche Menschen vermutlich in der Kategorie 2) oder 3) zu finden gewesen.

Das Verhältnis von 4) zur Gesamtbevölkerung ergibt eine wichtige Kenngröße, die Erkrankungsrate. Hier ist eine Tabelle, die ich einer Publikation des Robert-Koch-Institutes entnommen habe [1]. Sie beschreibt wichtige Kennzahlen der letzten großen Epidemien, die wohlgemerkt alle ohne irgendwelche großen Maßnahmen zur Eindämmung oder Abwehr des Virus abgelaufen sind.

Tabelle 1 – Kennzahlen verschiedener Pandemien in Deutschland (Ost und West gemeinsam; ich unterschlage die Bevölkerungszahl; sie liegt zwischen 62 und 82 Millionen)

Pandemie Erkrankungsrate in % Todesfälle Mortalität je 100.000 Letalität in %
1918/19 25 426.600 691 2,76
1957/58 „asiat. Grippe“ 31 29.100 40 0,13
1968-70 „Hongkong Grippe“ 21 46.900 60 0,29
2009 „Schweinegrippe“ 9 350 0,43 0,0048

Man erkennt daran, dass die Erkrankungsrate, also oben Kategorie 4)/Bevölkerungszahl auch bei den hochinfektiösen und gefährlichen Grippe-Epidemien nie mehr als ein Drittel der Bevölkerung betroffen hat. Ob das daran liegt, dass nie alle mit dem Erreger in Berührung kommen (Kategorie 1), oder schon immun sind (2), oder nur leichte oder gar keine Symptome erleben trotz Infektion (3) ist für diese Kennzahl unerheblich und meistens wissen wir das auch nicht.

In einer klassischen Studie infizierten Cohen und Kollegen 394 Medizinstudenten, die aufs Examen lernten, mit mit relativ harmlosen Rhino- , Syncytium und Corona-Viren, die Schnupfen auslösen [2]. Es gibt eine ganze Reihe ungefährlicher Corona-Viren. Die Autoren wollten eigentlich wissen, was der Examensstress mit den Studierenden macht. Interessanterweise lag die tatsächliche serologische Infektionsrate, also die nachweislich stattgefundene Infektion zwischen 74% und 90%, obwohl alle die Viren direkt in die Nase appliziert bekommen hatten. Das heißt: Trotz direktem Kontakt findet nicht notwendigerweise eine Infektion statt, z.B. weil schleimhautständige Immunglobuline (meistens der Klasse A) die Erreger sofort neutralisieren. Das wären Menschen der Kategorie 2) oder 3) oben. Und die wirkliche Krankheitsinzidenz lag zwischen 27% und 47%. Das sind Menschen der Kategorie 4) oben.

Diese Erkrankungsrate ist also eine zentrale Größe. Denn sie gibt Auskunft über die Erkrankungshäufigkeit – oder bei Kontakt mit dem Erreger über die Erkrankungswahrscheinlichkeit.

Wie kann man die Erkrankungsrate abschätzen? Nun, man kann es hinterher tun, wenn die Epidemie vorbei ist. Dann weiß man, wenn man mitgezählt hat, wie viele krank geworden sind, wie das für die großen Epidemie-Wellen in der Tabelle 1 der Fall ist. Oder im Fall von Cohens Studie, weil dort die Autoren wussten, dass sie alle direkt infiziert hatten. Was muss man tun, wenn man das, wie jetzt, während einer laufenden Erkrankungswelle mit einem neuartigen Erreger herausbekommen will? Ja, richtig: Man muss an einer für die Grundgesamtheit repräsentativen Stichprobe testen, wie viele krank sind – und das mehrmals, denn nur so kann man die Dynamik abbilden.

Weil das weder bei den italienischen noch bei den deutschen Covid-19 Erkrankten bekannt ist, können wir nicht abschätzen ob diese Epidemie sehr gefährlich ist, oder nicht. Aber vielleicht stimmt ja die Case-Fatality Rate, also die Mortalitätsrate der Erkrankten? Schließlich wurden die ja alle getestet, oder? Auch das ist wiederum nicht so einfach. Denn es wurden ja vor allem diejenigen getestet, die hoch symptomatisch waren, also eine Negativauswahl. Wenn wir alle, sagen wir in einem bestimmten Distrikt, testen, dann wissen wir, wie hoch die Anzahl der Infizierten ist (oben Kategorien 3) und 4)), und wenn wir dafür repräsentative Gruppierungen auswählen, so wie das etwa für die berühmte Sonntagsfrage gemacht wird, dann sind die Zahlen verlässlich.

Wenn wir nur die testen, die symptomatisch sind, dann finden wir Menschen der Kategorie 3) nicht, sondern nur der Kategorie 4). Damit entgeht uns ein wichtiges Stück Information, nämlich wie hoch die mögliche Immunität in der Bevölkerung ist bzw. wie infektiös der Erreger ist. Wenn wir nämlich viele Menschen finden, die zwar einen immunologischen Nachweis einer früheren Infektion haben, also Antikörper, ohne je Symptome gehabt zu haben, dann bedeutet das, dass sie gegen den Erreger immun sind. Und die Abschätzung dieses Prozentsatzes in der Bevölkerung könnte uns helfen, die obere Grenze der Erkrankungsrate zu projizieren. Sie kann nämlich maximal nur so hoch sein, wie der Anteil der nicht Immunen in einer Bevölkerung. Genauer gesagt wie etwa 80% der Nicht-Immunen. Denn wenn etwa 60-90% einer Bevölkerung Immunität gegen einen Erreger ausgebildet haben, dann ist das Reservoir für Replikationen für diesen Erreger erschöpft und die Epidemie stirbt.

Warum ist auch das Kolportieren von steigenden Fallzahlen, nackt, blanko und einfach so, ein fataler Kommunikationsfehler? Auch das hängt wieder damit zusammen, dass wir diese Zahlen im Verhältnis zu den durchgeführten Tests sehen müssen. Sehen wir das Beispiel Italien und Deutschland an: In Italien sind absolut gesehen mehr positiv auf Sars-CoV-2 getestete Fälle bekannt als in Deutschland. Aber sagt das etwas aus? Nein. Denn wir wissen nicht, wie viele Tests in Italien gemacht wurden und bei wem. In Deutschland wurden vergleichsweise, gerechnet auf die Bevölkerung wesentlich mehr Tests gemacht als in Italien und in Italien wurden vor allem nur die schwer Erkrankten getestet. Also ist die Wahrscheinlichkeit dort einen positiven Befund zu erhalten größer.

Das RKI hat am 2.4.2020 zum ersten Mal publiziert, wie hoch der Anteil der positiv Getesteten im Verhältnis zu den Tests war. Ich gebe die Daten in der Tabelle 2 wieder; die letzte Zeile ist von mir zu Demonstrationszwecken frei erfunden

Tabelle 2 – Durchgeführte Testungen und positiv Getestete

Kalenderwoche 2020 Anzahl Testungen Positiv getestet
11 127.457 7.582 (5,9%)
12 346.619 23.829 (6.8%)
Fiktiv von mir erfunden 80.000.000 5.600.000 (7%)

In den Abendnachrichten kommen folgende Zahlen vor: „Diese Woche wurden fast 24.000 Personen positiv auf Covid-19 getestet im Vergleich zu 7.582 letzte Woche, ein Anstieg um das Dreifache! Wir sehen also, wie schnell sich die Seuche ausbreitet! Schützen Sie sich, bleiben Sie zuhaus!“ Und? Stimmt das? Ja und nein? Natürlich wurden mehr positiv getestet, aber das ist keine Funktion des raschen Ansteigens der Erkrankung, sondern der Testungen. Wie man an den prozentualen Zahlen sieht, ist der Anstieg um einen Prozentpunkt sehr moderat. Würde jetzt der Nachrichtensprecher sagen: „Mittlerweile sind mehr als 5,5 Millionen Menschen positiv auf Covid-19 getestet worden, so viele wie in München und Berlin zusammengerechnet leben“, dann käme uns das enorm viel vor. Wäre aber dann, wenn wir wüssten, dass das aufgrund einer Volltestung der gesamten deutschen Bevölkerung gesagt worden wäre, prozentual genauso viel wie vorher, nämlich 7%.

Dieses Beispiel ist natürlich fiktiv, weil kein Mensch die gesamte Republik testen könnte und würde. Aber man sieht an dem Beispiel: Die absolute Zahl der positiv Getesteten macht nur Sinn im Kontext der Anzahl von Testungen und letztlich, streng genommen nur im Kontext einer repräsentativen Testung. Denn nur dann wüssten wir über die wahre Erkrankungsrate Bescheid.

Ob die Erkrankungsrate mit 7% richtig geschätzt ist, wissen wir nicht. Möglicherweise ist sie höher. Auf dem Schiff „Diamond Princess“, das in Yokohama unter Quarantäne gestellt wurde, wurden fast alle der 3711 Passagiere und Crewmitglieder getestet. 17% von ihnen hatten einen positiven Test und von diesen waren wiederum 47% symptomatisch erkrankt und von diesen starben insgesamt 7. Das macht eine Case-Fatality Rate von 2,3% und eine Infection-Fatality Rate von 1,2%. [3]

Es ist unklar, ob dieses Schiff eine saubere Repräsentation des Infektionsgeschehens abgibt. Denn wir wissen nicht, wie sich die Menschen auf dem Schiff bewegt haben, bevor die Krankheit entdeckt wurde und die Kranken unter Quarantäne gestellt wurden. Möglicherweise sind alle damit in Berührung gekommen und viele waren immun. Das ist unbekannt.

Wir nehmen jetzt einfach einmal diese Zahl von 17% als Erkrankungsrate an. Sie liegt, wie man an Tabelle 1 sieht, nahe an den bekannten Zahlen von früheren Epidemien. Wir nehmen die Case-Fatality Rate von 1,2%, die wir aus den deutschen Zahlen zur Zeit errechnen können, weil das Kreuzfahrtschiff mit seinem relativ alten Publikum nicht so repräsentativ ist und die deutschen Zahlen vielleicht etwas besser für unser Land passen. Ich habe das Berechnungsergebnis und verschiedene andere Szenarien in der Tabelle 3 zusammengestellt, immer berechnet auf die ungefähr 82 Millionen Bewohner unseres Landes.

Tabelle 3 – Verschiedene Szenarien von Erkrankungsfällen und Mortalitätsfällen in Abhängigkeit von verschiedenen Annahmen

Erkran-kungsrate Case Fatality Rate (Letalität) Zu erwartende Kranke Zu erwartende Todesfälle Mortalität je 100.000
17% 1,2% 13,94 Mio 167.280 204
7% 1,2% 5,74 Mio 68.880 84
3% 1,2% 2,46 Mio 29.520 36
17% 0,56% 13,94 Mio 78.054 95
7% 0,56% 5,74 Mio 32.144 39
3% 0,56% 2,46 Mio 13.776 17

Man sieht an Tabelle 3 sehr leicht, dass die zentrale Größe die Erkrankungsrate ist, wenn die Case-Fatality Rate konstant angenommen wird. Und auch die absolute Zahl der zu erwartenden Todesfälle ist eigentlich keine gute Zahl, weil sie nur auf die Zahl der Bevölkerung standardisiert, hier 82 Millionen, etwas aussagt. Sonst kann man Zahlen aus der Schweiz, aus Österreich und Italien nicht vergleichen. (Man könnte natürlich statt Mortalität je 100.000 auch Prozentangaben machen, hätte dann aber immer viele Stellen hinter dem Komma, was unpraktisch ist, weswegen es meistens auf 100.000 standardisiert wird).

Wir sehen, legen wir die 7% Erkrankungsrate zugrunde, die der momentane Prozentsatz als positiv Getesteter nahelegt, dann kommen wir auf eine Mortalität, die höher ist als bei der als Hongkong-Grippe bekannte Pandemie der 68er Jahre. Die Frage ist, wie realistisch diese Annahme ist. Da auch hierzulande nur Symptomatische getestet werden, dürfte dieser Wert den wahren Wert deutlich überschätzen. Auch noch mit einer niedrigeren Erkrankungsrate kommen wir auf eine relativ große Anzahl von zu erwartenden Todesfällen, die etwas höher liegt als bei der letzten großen Grippeepidemie, die 25.000 Exzesstodesfälle forderte, also Todesfälle, die nicht oder nicht zu diesem Zeitpunkt aufgetreten wären, wenn keine Grippewelle durchs Land gegangen wäre.

Legen wir die Letalität zugrunde, die das RKI bei seinen Modellrechnungen verwendet, also 0,56%, dann ändern sich die Zahlen deutlich.

Aber wir sehen auch: Selbst mit einer relativ hohen Erkrankungsrate liegen die zu erwartenden Todesfälle nicht annähernd in dem Bereich, die die Szenarien des RKI berechnet haben, die von 350.000 bis 400.000 Todesfällen ausgegangen sind, wenn keinerlei Maßnahmen zur Isolierung von Kranken angesetzt werden und die den derzeitigen Politik-Maßnahmen zugrunde liegen [4]. Warum ist das so? Ganz einfach. Das RKI hat einen Modellannahmefehler gemacht und ist davon ausgegangen, dass alle Infizierten auch symptomatisch werden, dass also die Erkrankungsrate nicht 17% beträgt, wie etwa auf dem Schiff, oder 7%, wie im Moment durch Testung nahegelegt, sondern schätzungsweise 70%. Das ist ein absolutes schlimmstes Szenario, das eigentlich kaum zu rechtfertigen ist. Mindestens im Moment nicht mehr.

Wir sehen an diesen Rechenbeispielen auch: Es gibt mehrere Stellglieder dieser Berechnungen. Ein sehr wichtiges ist die Erkrankungsrate, die wir bei uns im Moment nur aufgrund anderer Daten oder der Testergebnisse schätzen können. Und diese muss unbedingt standardisiert wiedergegeben werden, sonst sind die Zahlen irreführend. Ein weiteres wichtiges Glied ist die Letalität, also die Tödlichkeit der Erkrankung. Diese hängt der Sache nach in diesem Fall wesentlich von der medizinischen Betreuung ab. Sie hängt aber auch davon ab, wie weitgehend getestet wurde. Wurden viele Menschen positiv getestet und damit als erkrankt in die Statistik eingeführt, dann sinkt die Letalität bei etwa gleichbleibender Anzahl von Sterbefällen.

Diese Case-Fatality Rate, oder Letalität, also der Anzahl der Patienten, die erkrankt sind und sterben, ist schwer zu ermitteln. Denn im Moment werden alle, die sterben und bei denen ein Virustest positiv ausfällt als Covid-19 Tote gerechnet. Ist das zulässig? Eine Frage der Definition. Auch diese Zahl bläst die Letalität auf oder reduziert sie, je nachdem ob konservativ oder liberal gerechnet wird.

Wir sehen das tatsächliche Verhältnis der Covid-19 Pandemie im Vergleich zu den Grippe-Epidemien dieses Jahres und der vergangenen Jahre in folgender Abbildung. Sie stammt von Erwin Kainbacher, einem Mathematiker und Ingenieur aus Graz, der sie mir freundlicherweise angefertigt und zur Verfügung gestellt hat.

Abbildung – Anteil der Menschen mit respiratorischen Erkrankungen in Prozent der vergangenen Grippewellen im Vergleich mit den Erkrankungsraten von Covid-19 (rote Balken), die um den Faktor 10 vergrössert sind, damit sie überhaupt sichtbar sind

Man sieht auf der Seite links die Anzahl der Erkrankten in Prozent der Bevölkerung. Die bunten Kurven sind die verschiedenen Grippewellen; die schwarze ist die aktuelle Grippewelle. Die graue Region ist die Covid-19 Pandemie-Zeit. Die roten Balken sind die Anzahl der an Covid-19 Erkrankten, aber um den Faktor 10 multipliziert, damit man sie überhaupt in dieser Grafik sehen kann! Denn sonst würden sie verschwinden. Zahlen im Verhältnis sehen also anders aus, als absolut.

Wir sehen an all diesen Beispielen, wie kitzlig der Umgang mit absoluten Zahlen in der Epidemiologie ist. Zahlen gehören standardisiert und auf Grundeinheiten rückgerechnet, damit man sie vergleichen kann, am besten anhand robuster empirischer Befunde. Wo man das nicht hat, kann man, wie wir hier in Tabelle 3, verschiedene Annahmen treffen und sehen, wie sich das auswirkt. Natürlich haben wir in diesen Beispielen die Dynamik nicht berücksichtigt, sondern gewissermaßen den Endzustand, der erst bekannt ist, nachdem alles vorbei ist. Dynamische Modellierungen sind wesentlich komplexer, weil sich dort die Zahlen – Erkrankungsrate, Anzahl der Erkrankten und Genesenen – dauernd verändern und in dynamischen Modellen berechnet werden müssen, die Funktionen der Zeit sind. Aber selbst wenn man die Dynamik studiert, wie in der Abbildung, sieht man, dass auch das nur sinnvoll ist, wenn man es im Kontext tut.

Das zu zeigen war der Sinn dieser Übung.

Quellen

  1. Buchholz, U., Buda, S., Reuß, A., Haas, W., & Uphoff, H. (2016). Todesfälle durch Influenzapandemien in Deutschland 1918 bis 2009. Bundesgesundheitsblatt – Gesundheitsforschung – Gesundheitsschutz, 59(4), 523-536. https://doi:10.1007/s00103-016-2324-9
  2. Cohen, S., Tyrrell, D. A. J., & Smith, A. P. (1991). Psychological stress and susceptibility to the common cold. New England Journal of Medicine, 325, 606-612. https://www.nejm.org/doi/full/10.1056/NEJM199108293250903
  3. Russell, T. W., Hellewell, J., Jarvis, C. I., van-Zandvoort, K., Abbott, S., Ratnayake, R., . . . Kucharski, A. J. (2020). Estimating the infection and case fatality ratio for COVID-19 using age-adjusted data from the outbreak on the Diamond Princess cruise ship. Eurosurveillance, 25(12), pii=2000256. https://doi.org/10.2807/1560-7917
  4. an der Heiden, M., & Buchholz, U. (2020). Modellierung von Beispielszenarien der SARS-CoV-2-Epidemie 2020 in Deutschland. https://doi.org:10.25646/6571.2