Zwei Spieler und ein Betreuer mit dem Corona-Virus infiziert – diese Nachricht vom 1. FC Köln dürfte manchen überrascht haben. War das einfach nur großes Pech? Oder werden wir positive Tests jetzt öfters erleben, wenn die Bundesliga alle Teams regelmäßig untersucht?
Laufende Corona-Tests sind ein wichtiger Teil des Konzepts der Geisterspiele, mit dem die Bundesliga die derzeit unterbrochene Saison noch beenden will. In Liga 1 und 2 stehen noch neun Spieltage aus.
Nun gab es gleich zu Beginn der regelmäßigen Tests drei Positivfälle. Wie hoch ist eigentlich die Wahrscheinlichkeit dafür?
Ich habe ein wenig über diese Frage nachgedacht und festgestellt, dass das eine hübsche Fingerübung in Kombinatorik und Wahrscheinlichkeitsrechnung ist. Es wäre sicher auch ein schönes Thema für den Matheunterricht.
Das Ergebnis meiner Berechnungen hat mich selbst etwas überrascht: Sofern Infektionen unter Bundesliga-Fußballern genauso häufig sind wie in der Gesamtbevölkerung, liegt die Wahrscheinlichkeit für mindestens einen positiven Coronatest zwischen 0,4 und 0,9. Das gilt für einen einmaligen Test aller 36 Teams aus Liga 1 und 2. Ein ziemlich hoher Wert!
Wie habe ich das berechnet? Zunächst die Annahmen.
Anteil der infektiösen Menschen
Das Robert-Koch-Institut (RKI) beziffert die Zahl der täglichen Neuinfektion derzeit bei etwa 1000 (geschätzt über den Tag des Krankheitsbeginns, nicht über den Tag der Meldung!). Wir müssen aber von einer hohen Dunkelziffer ausgehen. Ich habe dabei zwei Varianten gewählt.
- Entweder sind es in Wahrheit 5000 Neuinfizierte pro Tag. Bei den Tests würde also nur jeder fünfte Infizierte gefunden.
- Oder es sind sogar 10.000 Neuinfizierte pro Tag. Bei den Tests würde dann sogar nur jeder zehnte Infizierte gefunden.
Ich habe angenommen, dass die Zahl der Neuinfizierten jeden Tag gleich bleibt. Damit ist der Reproduktionsfaktor gleich 1.
Weiterhin habe ich angenommen, dass das Virus im Hals der Infizierten an fünf aufeinanderfolgenden Tagen nachweisbar ist. Nur an diesen fünf Tagen kann der PCR-Test nach Abstrich im Rachen positiv ausfallen. Diese Anzahl der Tage könnte auch größer sein, das würde das Ergebnis der Berechnung verändern. Um einen solchen Effekt zumindest abschätzen zu können, habe ich auch ein Szenario mit zehn Tagen durchgerechnet.
Zunächst bleibe ich aber bei fünf Tagen. Fünf Tage Infektiosität würde bedeuten: Pro Tag sind 5*5000 = 25.000 beziehungsweise 50.000 Menschen (=5*10.000) infektiös. Würde man an einem Tag alle 83 Millionen Bewohner Deutschlands testen, gäbe es 25.000 oder – bei Annahme der höheren Dunkelziffer – 50.000 positive Ergebnisse.
Dies entspricht 0,03 Prozent beziehungsweise 0,06 Prozent der Bevölkerung. Wer es etwas anschaulicher mag: Entweder ist einer von 3320 Menschen positiv oder einer von 1660.
Ist das Virus nicht fünf, sondern zehn Tage im Rachen nachweisbar, verdoppeln sich die Prozentwerte auf 0,06 beziehungsweise 0,12 Prozent der Bevölkerung, was 50.000 oder 100.000 infektiösen Menschen pro Tag entspricht. Dann wäre einer von 1660 oder einer von 830 Getesteten positiv.
Fasst man alle Szenarien zusammen, kommt man auf drei verschiedene Häufigkeiten von Infizierten mit nachweisbaren Viren im Rachen: Einer auf 830, 1660 oder 3320 Menschen.
Zahl der Tests bei Bundesliga-Teams
Laut den Angaben der DFL sollen von jeder Mannschaft nicht nur alle Spieler getestet werden – das sind meist 20 bis 30 -, sondern auch die Trainer, Mediziner, Physiotherapeuten und sonstigen Betreuer. Also alle, die in engem Kontakt zu den Spielern stehen. Dies sind laut DFL 50 Personen pro Team. Die beiden Bundesligen kommen zusammen auf 36 Teams. Wir reden hier also von 36*50 = 1800 Personen, die zugleich getestet werden.
Etwas Kombinatorik
Bei der folgenden Beispielrechnung gehe ich davon aus, dass im Durchschnitt eine von 1660 Personen im Rachen Corona-positiv ist. Ich teste alle 36 Liga-Teams – also 1800 Personen. Falls die Infektionsrate innerhalb der Teams genauso groß ist wie in der Gesamtbevölkerung, sollte im Durchschnitt etwas mehr als ein Test positiv ausfallen.
Ich möchte aber etwas genauer hinschauen: Wie groß ist die Wahrscheinlichkeit, dass alle 1800 Tests negativ sind? Und wie groß ist die Wahrscheinlichkeit, dass genau einer positiv ist? Oder mindestens einer?
Wer sich noch an Wahrscheinlichkeitsrechnung und Kombinatorik erinnert, weiß wahrscheinlich wie es weiter geht: Wir brauchen den Binomialkoeffizienten.
Fangen wir mit dem einfachsten Fall an: Alle 1800 Tests sollen negativ sein. Ich kann mir einen Corona-Test auch als Wurf mit einer Münze vorstellen. Die eine Seite der Münze steht für ein negatives Ergebnis, die andere für ein positives.
Bei einer Münze sind die Chancen normalerweise fifty-fifty. Die Corona-Test-Münze ist jedoch gezinkt: Nur mit p=1/1660 landet sie auf der Positiv-Seite, mit p=1659/1660 auf der Negativ-Seite.
Wenn ich 1800 Tests mache, werfe ich die Corona-Münze 1800 Mal hintereinander und sammle die Ergebnisse in einer Strichliste.
Wenn es keinen einzigen positiven Test gibt, also alle Tests negativ sind, ist die Wahrscheinlichkeit dafür:
p(0) = (1659/1660)^1800
p(0) = 0,338..
Wenn genau einer der 1800 Tests positiv sein soll, ist das Ergebnis
p(1) = (1659/1660)^1799 * (1/1660) * (1800 über 1)
p(1) = (1659/1660)^1799 * (1/1660) * 1800
p(1) = 0,367..
(1800 über 1) ist der Binomialkoeffizient. Er gibt an, wie viele verschiedene Möglichkeiten es gibt, dass von 1800 Würfen ein einziger positiv ist. Es sind genau 1800 verschiedene:
- Wurf 1 ist positiv, alle anderen sind negativ,
- Wurf 2 ist positiv, alle anderen sind negativ,
- Wurf 3 ist positiv, alle anderen sind negativ,
- …
- bis Wurf 1800 ist positiv, alle anderen sind negativ.
Die allgemeine Formel lautet (n über k) = n!/( (n-k)! * k! ) – siehe https://de.wikipedia.org/wiki/Binomialkoeffizient
Wie groß ist die Wahrscheinlichkeit, dass genau 2 der 1800 Würfe ein positives Ergebnis haben? Auch das berechnen wir mit dem Binomialkoeffizienten – nun aber (1800 über 2):
p(2) = (1659/1660)^1798 * (1/1660)^2 * (1800 über 2)
p(2) = (1659/1660)^1798 * (1/1660)^2 * 1.619.100
p(2) = 0,199..
Auf diese Weise könnten wir für jede einzelne Anzahl positiver Tests die Wahrscheinlichkeit berechnen.
Ergebnisse für Tests mit 1800 Personen
Folgende Tabelle enthält die Wahrscheinlichkeiten dafür, dass 0, 1, 2, 3… Personen von 1800 getesteten positiv sind. Berechnet ist dies für die drei oben genannten Häufigkeiten infektiöser Menschen in der Gesamtbevölkerung (pi = 1/3320, pi = 1/1660, pi = 1/830).
Wenn wir annehmen, dass die Corona-Infektionen in der Gruppe der 1800 Fußballer, Trainer und Betreuer genauso groß sind wie in der Gesamtbevölkerung, sind ein oder mehr positive Tests alles andere als unwahrscheinlich.
Schauen wir zuerst in die mittlere Spalte: Falls eine von 1660 Personen im Rachen nachweisbare Viren hat, ist die Wahrscheinlichkeit für genau einen positiven unter 1800 Tests nur minimal größer als für keinen einzigen positiven Test. Die Wahrscheinlichkeit für mindestens einen positiven Test ist mit p = 0,662.. deutlich größer als für 1800 negative Tests (p = 0,338).
Sind infektiöse Menschen doppelt so häufig (rechte Spalte), werden ausschließlich negative Tests mit p = 0,1142 schon relativ unwahrscheinlich. Mit jeweils p = 0,248 und p = 0,269 sind entweder genau ein Test oder zwei positiv. Die Wahrscheinlichkeit für mindestens einen positiven Test beträgt 0,8858. Und für mindestens zwei positive Tests immer noch mehr als 0,6.
Nur in der linken Spalte (pi = 1/3320) ist die Wahrscheinlichkeit für keinen einzigen negativen Test größer als 0,5 – aber auch hier sind ein oder mehr positive Tests mit p > 0,4 keine Seltenheit.
Fazit: Wir müssen bei den Tests der 1800 Teammitglieder häufig mit mindestens einem positiven Testergebnis rechnen.
Folgendes Diagramm zeigt die Verteilung der Wahrscheinlichkeiten in den drei Szenarien, die x-Achse zeigt die Anzahl positiver Tests, y steht für die Wahrscheinlichkeit.
Kann das überhaupt stimmen?
Die Berechnung hat in meinen Augen zwei Schwächen. Zum einen ist unklar, ob man einfach so annehmen kann, dass Infektionen innerhalb der Fußballteams genauso häufig auftreten wie in der Gesamtbevölkerung. Hier könnte das Umfeld der Spieler eine Rolle spielen – aber auch die Tatsache, dass die Spieler in der Regel nicht mal 30 Jahre alt sind. Wir wissen bislang nicht genau, wie oft sich junge Erwachsene überhaupt infizieren.
Ein zweites, zumindest statistisches Problem ist die Häufung von Infektionen, wie wir sie im Fall des 1. FC Köln gesehen haben. Weil Spieler und Betreuer in kleinen Gruppen sehr eng zusammen sind, wird eine einzige Infektion sehr schnell an andere Teammitglieder weitergegeben. Die Infektion einer Einzelperson könnte daher eher selten sein, Infektionen treten womöglich häufiger als Cluster auf.
Es ist so ähnlich wie bei Familienmitgliedern, die in einem Haushalt zusammenwohnen. Auch hier bilden die Personen ein Cluster. Man kann sie nicht als Einzelpersonen betrachten, die voneinander unabhängig sind.
Wollte man beispielsweise anhand der positiven Tests unter Fußballteam-Mitgliedern die Häufigkeit positiver Tests abschätzen, müsste man womöglich die drei Personen eines Infektionsclusters zu einer Person (oder auch zu 1,5 Personen) zusammenfassen. Auf diese Weise vermeiden Epidemiologen Verzerrungen in ihren Daten.
Christian Drosten hat dies in einem seiner Podcasts für das Beispiel Gangelt (Landkreis Heinsberg) beschrieben. Dort wurden von einem Team des Virologen Hendrik Streeck viele Bewohner auf Antikörper getestet. Die Häufigkeit von Infektionen könnte überschätzt werden, falls der Faktor „wohnen gemeinsam in einem Haushalt“ nicht herausgerechnet wird.
Auch bei den Fußballern könnten die Infektionszahlen wegen des Clustereffekts verzerrt sein.
Fazit
Die simple Kalkulation zeigt, dass die DFL wohl mehr als nur einmal mit positiven Tests rechnen muss, sofern die simplen Annahmen der Kalkulation stimmen. Solange man auf Tests im Abstand von einer Woche schaut, kann man jeden dieser Tests mit 1800 Personen womöglich sogar als unabhängig von den vorherigen Tests betrachten – und damit als eine neue Stichprobe. Das gilt natürlich nur solange, wie die Zahl positiver Tests im Verhältnis zur Personenzahl klein bleibt, weil einmal Infizierte ja aller Voraussicht nach nicht noch mal infiziert werden können.
Wenn Spieler nun auch unter Körperkontakt trainieren und demnächst die eigentlichen Spiele beginnen, könnte aus einer Infektion, die ein Teammitglied einträgt, schnell ein Cluster von mehreren Infizierten werden. Wenn dies wiederholt geschieht, dürfte es schwierig werden mit dem regulären Beenden der Saison.
Es ist aber auch möglich, dass die positiven Tests beim 1. FC Köln tatsächlich nur großes Pech waren. Weil die Wahrscheinlichkeit für solche Infektionen in den Teams ein ganzes Stück kleiner ist als in den drei beschriebenen Szenarien.