Dr. Michael Böhme bereitet Fallzahlen zu COVID-19-Erkrankungen in Thüringen grafisch auf

Seit Anfang März die ersten COVID-19-Fälle auch in Jena auftraten, erfasst Dr. Michael Böhme automatisch die von der Stadt veröffentlichten Daten zu Fallzahlen und bereitet sie grafisch auf. Was aus privatem wissenschaftlichen Interesse begann, hat sich inzwischen zu einer wichtigen Informationsquelle entwickelt: Etwa 2.500 Zugriffe zählt die Seite täglich. Warum eine detaillierte Datenerfassung wichtig ist und was sich aus solchen Grafiken mathematisch ableiten lässt, das erläutert der Chemiker vom Institut für Anorganische und Analytische Chemie im Interview.

Sie bereiten für die Stadt die Corona-Statistik auf. Wie kam es dazu?

Ich begann mich, wie viele andere aufgrund der Berichterstattungen aus China für dieses Thema zu interessieren. Spätestens seit den ersten bestätigten Fällen in Thüringen Anfang März ist mir persönlich das Thema aber so richtig bewusst geworden. Glücklicherweise hat die Stadt Jena bereits frühzeitig damit begonnen, die bestätigten Fallzahlen auf ihrer Homepage zu veröffentlichen. Um die Situation vor Ort abschätzen zu können, hielt ich jedoch die reine Angabe der täglich steigenden Fallzahl an bestätigten COVID-19-Infektionen für nicht so aussagekräftig. Für mich persönlich war es wichtig, diese Fallzahlen im zeitlichen Verlauf zu betrachten und damit die Dynamik einordnen zu können. Deswegen habe ich aus meiner wissenschaftlichen Neugier heraus am 17. März damit begonnen, ein erstes Python-Skript zu schreiben, welches die Fallzahl automatisiert von der Homepage der Stadt Jena abfragt und die Ergebnisse grafisch auf meiner Homepage darstellt.

Schließlich habe ich dieses Projekt auf Twitter geteilt und es ist im Laufe der Zeit immer weiter gewachsen. Irgendwann wurde das Social-Media-Team der Stadt Jena auf mich aufmerksam und wollte meine Diagramme auf ihrer Homepage einbetten. In der Zwischenzeit begann auch der Freistaat Thüringen eine ausführliche tägliche Statistik in Form einer großen Tabelle zu veröffentlichen und immer mehr Kommunen in Thüringen kommunizieren die aktuellen Fallzahlen auf ihren Webseiten. Das war für mich Ansporn, diese Daten ebenfalls zu dokumentieren und grafisch darzustellen.

Warum ist die grafische Analyse solcher Daten wichtig und warum sollten diese Daten öffentlich zugänglich sein?

Die ergriffenen Maßnahmen und unser aller Handeln haben einen direkten Einfluss auf die Ausbreitungsgeschwindigkeit des Virus, die man meiner Meinung nach grafisch schnell erfassen kann. Ich halte deshalb die öffentliche Verfügbarkeit von Daten in Bezug auf COVID-19 im Sinne des Begriffs „OpenData“ für sehr wichtig. Als ein sehr lobenswertes Beispiel für OpenData möchte ich an dieser Stelle die offizielle COVID-19-Statistikseite von Island nennen. Dort werden nicht nur die Fallzahlen in ihrem zeitlichen Verlauf grafisch dargestellt, sondern es werden auch viele zusätzliche anonymisierte Daten gezeigt, wie etwa die Anzahl der durchgeführten Tests, der Ursprung der Infektion und die regionale Verbreitung. Zusätzlich können sämtliche Rohdaten direkt von der Seite heruntergeladen werden. Ich halte eine solch große Transparenz für sehr förderlich in Bezug auf die Aufklärung der Bevölkerung und in der Folge sorgt sie sicherlich auch für eine verbesserte Akzeptanz für die ergriffenen Maßnahmen. Leider musste ich feststellen, dass in Thüringen die Verfügbarkeit, Qualität und Aktualität von Fallzahlen noch weit von dem Beispiel Islands entfernt ist und auch starke regionale Unterschiede bestehen. Ich würde mir wünschen, dass wir bei uns ein ähnliches Maß an Aufklärungswillen und Transparenz von offiziellen Seiten erreichen könnten. Die tägliche Statistik der Thüringer Landesregierung, die Daten über alle Regionen in Thüringen liefert, kann sicherlich noch ausgebaut werden.

Wie läuft Ihre aktuelle Arbeit in Sachen Corona-Statistik ab?

Die Erfassung der Daten und deren Darstellung habe ich inzwischen vollautomatisiert, wodurch überhaupt erst die große Anzahl an Grafiken und der daraus resultierende Informationsgehalt ermöglicht werden. Die Daten beziehe ich direkt von den Webseiten der Kommunen, des Freistaat Thüringens und des Robert Koch-Instituts. Generell versuche ich bei der Webseite und den Daten immer nach bestem Wissen und Gewissen zu arbeiten und daher habe ich die Quellenübersicht auf meiner GitHub-Seite transparent gemacht. Nahezu täglich müssen kleinere Anpassungen an den entsprechenden Programmen vorgenommen werden, damit eine Automatisierung auch weiterhin gewährleistet bleibt. Gerade zu Beginn des Projekts war dies zeitintensiv, da sich nahezu täglich der Informationsgehalt und die Darstellungsart der Daten auf den Webseiten geändert haben. Einige Kommunen fassen beispielsweise ihre aktuellen Fallzahlen tabellarisch zusammen und andere als ausgeschriebene Texte. Insbesondere aus Texten heraus, sind die Daten wesentlich schwieriger mit Programmen automatisiert zu erfassen, so dass ich immer etwas Zeit in die Kontrolle der Daten stecken muss. Die Programme, welche die Daten erfassen, müssen zudem flexibel sein, etwa für den Fall, dass eine Webseite einer Kommune mal nicht erreichbar sein sollte. Leider muss ich anmerken, dass ein paar Kommunen in Thüringen gar keine eigenen Informationen ihres örtlichen Gesundheitsamts zur Verfügung stellen.

Eine genaue Zeit, die ich bisher in dieses Projekt gesteckt habe, kann ich gar nicht beziffern. Mich erreichen aber inzwischen täglich E-Mails mit Danksagungen, Kritiken und neuen Ideen, die mich motivieren, dieses Projekt weiter fortzusetzen. Unterstützung erhalte ich auch auf andere Art und Weise, denn ein guter Freund hat mir dabei geholfen, eine interaktive Thüringenkarte für meine Seite zu entwickeln, mit der die tagesaktuelle Statistik der Thüringer Landesregierung visualisiert wird.

Welche Möglichkeiten gibt es, solche Wachstumsraten grafisch darzustellen und wonach richtet sich die jeweilige Auswahl?

Im einfachsten Fall werden die Fallzahlen im zeitlichen Verlauf dargestellt. Exponentielles Wachstum ist aber für viele Menschen, mich eingeschlossen, nicht immer ganz einfach zu begreifen. Man kann deshalb die Fallzahlen auch logarithmisch darstellen, wodurch sich bei einem exponentiellen Wachstum eine Gerade ergibt. Aus dem Anstieg dieser Geraden lässt sich wiederum die Verdopplungszeit ableiten. Für eine bessere optische Abschätzung verwende ich zusätzlich auf meiner Seite Hilfslinien in einem solchen Diagramm. Weiterhin stelle ich auf Thüringen bezogen große Schwankungen in der Anzahl der täglichen Neuinfektionen fest, wodurch ich dazu übergegangen bin, neben der täglichen Neuinfektionen auch die aufsummierten Fälle pro Kalenderwoche als Balkendiagramm darzustellen. Mein Ziel ist es immer, durch eine geeignete Darstellung die Zahlen getreu dem Motto „ein Bild sagt mehr als 1.000 Worte“ leicht verständlich und schnell erfassbar zu machen.

Wie oft werden die COVID-19-Grafiken von Ihnen aktualisiert?

Die Programme, welche die Daten automatisiert von den Webseiten der Kommunen abfragen, laufen momentan in einem stündlichen Rhythmus. Es dauert mit anderen Worten maximal eine Stunde bis die Grafiken aktualisiert werden, sobald sich die Fallzahlen auf einer der erfassten Webseiten ändern. Die einzelnen Statistiken des Landes und der Kommunen werden zu unterschiedlichen Zeiten aktualisiert, wodurch je nach Tageszeit die ein oder andere Statistik die aktuelleren Zahlen liefert und es auch zu Unterschieden in den Zahlen kommt. So veröffentlicht beispielsweise das Robert Koch-Institut jeden Morgen um 8 Uhr seine Statistik mit dem Stand von 0 Uhr. Die Thüringer Landesregierung folgt darauf am frühen Nachmittag mit einer Statistik mit dem jeweiligen Stand von 10 Uhr. Kommunen wie etwa die Stadt Jena fassen ihre tagesaktuellen Zahlen in Abendlagen zusammen.

Wenn wir auf die Grafik zu aktuellen Fallzahlen in Thüringen (Jena) schauen: Was lässt sich aus einer solchen Kurve ablesen?

Die reinen Fallzahlen werden mit der Zeit stetig ansteigen, ich betrachte aus diesem Grund auch lieber die „aktiven Fälle“. Diese Größe ergibt sich aus der Gesamtfallzahl minus der Genesungen und Todesfälle. Für Thüringen insgesamt stellt man aktuell fest, dass die Zahl der „aktiven Fälle“ seit dem 14.04.2020 jetzt eine Woche lang bei ungefähr 500 stagniert. Betrachtet man die Entwicklungen auf regionaler Ebene, so stellt man aber grundsätzliche Unterschiede fest. Die meisten täglichen Neuinfektionen kommen aktuell aus den Landkreisen Greiz und Gotha, wohingegen die Zahl in den meisten anderen Regionen Thüringens nur sehr langsam wächst, zum Teil mit Verdopplungszeiten von über drei Wochen.

Für Jena stellt man aktuell (21.04.2020) fest, dass die bestätigte Fallzahl seit zwölf Tagen konstant bei 155 liegt. Gleichzeitig steigt die Zahl der Genesungen rasch an, wodurch die Anzahl der aktiven COVID-19-Fälle mit ihrem Höhepunkt am 01.04. immer weiter absinkt. Ohne jetzt in komplexere Berechnungen zu verfallen, lässt sich an der zeitlichen Entwicklung der aktiven Fälle aber bereits gut erkennen, dass wir inzwischen in Jena eine Reproduktionsrate R von weit unter 1,0 erreicht haben. Wichtig ist hierbei aber immer zu beachten, dass diese Aussagen nur valide in Anbetracht der bestätigten Fälle sind und die Dunkelziffer komplett vernachlässigt wird. Neben den Zahlen der Stadt Jena ergänze ich die Datenlage zusätzlich um die Altersdaten, die das Robert Koch-Institut bereitstellt. Hier lässt sich feststellen, dass in Jena momentan die Altersgruppe der 15- bis 34-jährigen Personen das Maximum an Infektionen bildet. Eine Tatsache, die wohl direkt mit dem niedrigeren Durchschnittsalter in der Stadt korreliert und dazu führt, dass, in Relation zur Gesamtzahl der COVID-19-Fälle, die Stadt Jena im Vergleich zu anderen Kommunen in Thüringen weniger schwere Verläufe und Todesfälle aufweist.

Welche möglichen Extrapolationen gibt es für derartige Kurven?

Ich verwende auf meiner Seite Exponentialfunktionen, um damit Momentaufnahmen auf Basis der aktuellen Zahlen zu generieren und Parameter wie die Verdopplungszeiten zu bestimmen. Was Extrapolationen für die Zukunft anbelangt, habe ich mich dazu entschlossen, keine Prognosen auf Grundlage der Zahlen zu machen, auch wenn ich bereits vermehrt Anfragen diesbezüglich per E-Mail erhalten habe. Das möchte und muss ich den Expertinnen und Experten überlassen. Ich denke, es wäre fahrlässig, weil sich andere Menschen auf solche Prognosen verlassen könnten. Zusätzlich dazu stelle ich mir Prognosen aktuell sehr schwierig vor, da sich nahezu wöchentlich Verordnungen und Maßnahmen ändern, etwa die Einführung einer sogenannten „Maskenpflicht“ oder die schrittweise Wiederöffnung der Schulen. Ich denke, dass deshalb weitaus komplexere mathematische Modelle notwendig sind, die weit über meine Expertise als Chemiker hinausgehen.

Wie stehen Sie als Datenexperte zur Informationsgewinnung durch Handytracking?

Ich muss zugeben, dass ich mir zur Thematik „Corona-App“ noch keine abschließende Meinung gebildet habe. Mir ist bekannt, dass bereits eine große Anzahl solcher Apps getestet werden und, insofern man diese Art der Informationsgewinnung betreiben möchte, sich die Gesellschaft auf freiwilliger Basis am Ende auf eine App einigen müsste. In diesem Zusammenhang halte ich die vom Chaos Computer Club herausgegebene Liste mit 10 Prüfsteinen für die Beurteilung solcher Apps für relevant und wegweisend. Verwertbare Daten kann man mit solchen Maßnahmen wohl auch nur gewinnen, wenn es eine breite Akzeptanz in der Bevölkerung dafür gibt. Dafür ist es essenziell, dass auch Datenschutzbedenken berücksichtigt werden und der Quellcode öffentlich einsehbar ist. Was es aber aus meiner Sicht auf gar keinen Fall geben darf, ist eine Verpflichtung per Verordnung der Bürgerinnen und Bürger zu einer Installation einer solchen Tracking-App. Eine allgemeine Verpflichtung wäre, was die individuellen Freiheitsrechte anbelangt, aus meiner Sicht zu invasiv und könnte dem Vertrauen in unseren Rechtsstaat immens schaden. Und ganz pragmatisch: Mit einem App-Zwang könnte man am Ende auch nicht verhindern, dass Menschen, die sich mit einer solchen App nicht verfolgen lassen möchten, beim Einkauf einfach ihr Telefon abschalten oder im Auto lassen.

Wie lange werden Sie die Corona-Statistik noch fortsetzen?

Wie Expertinnen und Experten immer wieder darauf hinweisen, befinden wir uns bei dieser Pandemie noch ziemlich am Anfang. Ich halte es daher für essenziell, die Daten fortlaufend zu dokumentieren, auch wenn aktuell die Neuinfektionen sinken und über das Jahr hinweg das öffentliche Interesse vielleicht auf anderen Themen gelenkt werden. Ein weiterer wichtiger Punkt hierbei ist auch die geplante schrittweise Zurücknahme der ergriffenen Maßnahmen, die in regelmäßigen Abständen immer wieder neu evaluiert werden muss. Meine Intention ist es, mit der Bereitstellung der Grafiken zu einer breiteren Aufklärung in der Bevölkerung über die aktuelle Situation in Bezug auf das Coronavirus vor Ort beizutragen. Insofern werde ich die Daten in nächster Zeit weiter sammeln und darstellen.

Womit beschäftigen Sie sich ansonsten in Ihrer wissenschaftlichen Arbeit?

Ich bin an der Friedrich-Schiller-Universität in der Arbeitsgruppe von Herrn Prof. Dr. Winfried Plass als theoretischer Chemiker tätig und beschäftige mich wissenschaftlich mit computergestützten Berechnungen an magnetischen Molekülen, hauptsächlich sind dies sogenannte Einzelmolekülmagnete. Solche Moleküle sind einzeln magnetisierbare kleine Permanentmagnete, die sich potenziell später einmal als magnetischer Datenspeicher eignen und die Speicherdichte von Datenträgern deutlich erhöhen könnten. Durch meine wissenschaftlichen Berechnungen an solchen Systemen überprüfe und ergänze ich die experimentellen Ergebnisse meiner Kollegen, wodurch wir Trends erkennen und diese Moleküle in ihren Eigenschaften verbessern können. In dem ein oder anderem Zusammenhang arbeite ich dabei ebenfalls mit Exponentialfunktionen, etwa bei der Beschreibung des temperaturabhängigen magnetischen Relaxationsverhaltens oder bei der Beschreibung der magnetischen Domänengrößen in Einzelkettenmagneten.