Leider leben wir in einer Zeit, in der wissenschaftliche Forschung vor politischen Vorgaben buckelt, eine Zeit, in der Kenntnis über die Wirklichkeit ideologischen Vorgaben geopfert wird. Das geht auf Dauer natürlich nicht gut. Aber wie sagte schon Konrad Adenauer als im gesagt wurde, dass seine gesetzliche Rentenversicherung in 30 Jahren nicht mehr finanzierbar sein werde: Da bin ich nicht mehr da…

Beginnen Sie Ihren Einkauf bei uns!

Vielleicht hätte die Studie von Gabriele Doblhammer, Constantin Reinke und Daniel Kreft wirklich etwas werden können. Vielleicht hätte sie etwas werden können, wenn die drei Autoren eine theoretische Grundlage für ihre Arbeit hätten, wenn sie die Auswahl ihrer Daten auf Basis von Hypothesen, die aus Theorien, nicht aus ebenso theorielosen Data-Speak-to-me-Studien abgegriffen worden wären, getroffen hätten, wenn sie ihrer Fragestellung nicht mit einer Unzahl von Variablen, die regelrecht zusammengerafft wurden, zuleibe gerückt wären, wenn sie nicht, um es einmal bildlich darzustellen, das Haus abgerissen hätten, um im Schutt nach der Ursache für den Brand im Kinderzimmer zu suchen und vor allem, wenn sie nicht den Kotau vor politischer Korrektheit gemacht hätten, den man heute wohl an Hochschulen machen muss, die eher ideologischem Wahn als empirischer Forschung zugänglich sind. Nun haben die Autoren aber diesen Kotau gemacht und ihre Arbeit durch die Inklusion von mindestens einer Variable unter 154 weiteren Variablen diskreditiert: Stimmenanteil der AfD bei der Bundestagswahl 2017 [Es ist nicht verboten, diese Variable in die Analyse einzuschließen, wenn man es aber tut, dann muss man, gerade im derzeitigen politischen Klima Sorge dafür tragen, dass die Variable auch korrekt eingebunden ist und vor allem nicht für sich alleine steht – besonders bei ökologischen Analysen ist das wichtig – aber dazu gleich].

Bevor wir die Arbeit im Einzelnen auseinander nehmen, eine Frage vorab. Die Analysen der drei Nachwuchswissenschaftler zeigen, dass sowohl der Stimmenanteil der AfD als auch der Migrantenanteil positiv mit der Inzidenz von SARS-CoV-2 und der Inzidenz der an COVID-19 Verstorbenen korrelieren. Was glauben Sie, wenn diese Studie in die Hände eines Journalistendarstellers fällt, welches Ergebnis berichtet werden wird und welches unter den Tisch fällt?

Wir glauben auch, dass Sie von Migranten als Treiber hinter der Verbreitung von SARS-CoV-2 und dem Sterben an COVID-19 nichts lesen werden. Wie gewöhnlich werden sich Journalistendarsteller das Ergebnis aussuchen, das ihnen ideologisch in den Kram passt, und wie gewöhnlich werden sie das Ergebnis präsentieren, das man besser, ob eklatanter methodischer Mängel, verschwiegen hätte.

Die Studie, die Doblhammer, Reinke und Kreft vorgelegt haben, ist eine ökologische Studie, d.h. auf der Grundlage räumlicher Gebiete wird nach Zusammenhängen zwischen einer oder zwei abhängigen Variablen und sie vielleicht erklärender Variablen gesucht. Die Ebene der Analyse sind somit Anteile für eine räumliche Ebene: Der Anteil der Ausländer an der Bevölkerung, die Lebenserwartung, das durchschnittliche Alter der Bevölkerung. Alle Variablen sind aggregiert, d.h. sie beschreiben nicht Indviduen, sondern Aggregate für eine räumliche Ebene und im Ergebnis Zusammenhänge zwischen Aggregaten auf räumlicher Ebene. Die räumliche Ebene in den Analysen von Doblhammer, Reinke und Kreft das sind Landkreise und kreisfreie Städte, 401 an der Zahl. Für jeden dieser 401 Landkreise und kreisfreien Städte haben die Autoren 155 Variablen zusammengetragen, die sie Bereichen zuordnen, z.B. den Bereichen Alter/Altern, “Ausländer/Migration”, “Geographie”, “Sozioökonomischer Status” usw.

Es ist wichtig, dass diese Variablen keine individuellen Daten umfassen, sondern aggregierte Daten: den Anteil der Ausländer an der Wohnbevölkerung in einem Landkreis oder eine kreisfreien Stadt, den Anteil der Personen, die jünger als 6 Jahre alt sind, die Veränderung im Anteil von Ausländern in den letzten Jahren, den Stimmenanteil der AfD bei der letzten Bundestagswahl, das durchschnittliche Einkommen von Arbeitnehmern, den Lohnzuwachs über die letzten Jahre und vieles mehr, alles auf Ebene von Landkreisen / kreisfreien Städten.

Wie gesagt, die Autoren tragen 155 Einzelindikatoren für Landkreise und kreisfreie Städte zusammen, die sie in einen Zusammenhang mit der Inzidenz von SARS-CoV-2 und den an COVID-19 Verstorbenen bringen wollen, natürlich in dem Bemühen, eine Idee darüber zu gewinnen, was die Inzidenzen treiben könnte.

Ökologische Analysen, Aggregatdatenanalysen im Allgemeinen, sind eine problematische Sache und ihre Validität, sie lebt in nahezu allen Fällen nicht nur davon, dass die Auswahl der Indikatoren theoretisch begründet ist (was in dieser Studie nicht der Fall ist), sie lebt vor allem davon, dass vorhandene Indikatoren so gut wie möglich ausgeschöpft werden: Je besser beschrieben z.B. der sozioökonomische Status der Bevölkerung eines Landkreises ist, desto eher kann man davon ausgehen, dass ein Zusammenhang, wenn er sich denn in den Daten finden lässt, einen tatsächlich in der Realität vorhandenen Zusammenhang zwischen sozioökonomischem Status und Inzidenzwerten im vorliegenden Fall beschreiben könnte. Und natürlich ist eine ökologische Studie insbesondere davon abhängig, dass die Annahmen, die letztlich in die Auswahl eines Indikatoren fließen, nachvollziehbar sind, dass man z.B. weiß, warum der Stickstoffüberschuss auf agrarisch genutzten Flächen aus dem Jahre 2016 in dieser Arbeit berücksichtigt wird, was er denn als Indikator anzeigen soll. Es wäre ein Leichtes, die vorliegende Arbeit schon aufgrund der zum Teil wilden Annahmen, die mit den Daten verbunden sind, zu kritisieren und generell die Frage zu stellen, ob das, was die Autoren messen wollen, mit ihren Daten überhaupt gemessen werden kann, aber das wollen wir an dieser Stelle gar nicht tun. Reduzieren wir unsere Erwartungen und tragen – nachdem theoretische Kriterien ebenso wenig wie Kriterien einer sinnvollen Operationalisierung nicht weit tragen, quantitativ-statistische Kriterien an die Arbeit heran, um zu retten, was zu retten ist.

Das einfachste quantitative Kriterium, an dem die Frage, ob eine ökologische Analyse Müll oder vollständiger Müll oder halbwegs brauchbar ist, entschieden werden kann, ist die Vollständigkeit der Datenauswahl. Wenn man z.B. den sozioökonomischen Status der Bevölkerung eines Landkreises auf EBENE DES LANDKREISES beschreiben will, dann gibt es eine Vielzahl von Indikatoren, von der Arbeitslosigkeit bis zum durchschnittlichen Nettoeinkommen, vom Anteil der Abuiturienten bis zum Anteil der Schulabgänger ohne Abschluss, die man zu Rate ziehen kann. In dieser Hinsicht haben die Autoren in einigen Fällen gute Arbeit geleistet. So finden sich unter den 155 Variablen 61 Variablen, die den sozioökonomischen Status der Bevölkerung in einem Landkreis beschreiben. Vom Bruttosozialprodukt, über die Absolventenquote bei tertiärer Bildung bis zum Anteil der unqualifizierten Arbeiter mit Anstellung. Man kann sagen, die Ergebnisse, die im Hinblick auf den sozioökonomischen Status präsentiert werden, können einiges an Validität beanspruchen. Bei Ergebnissen, die sich auf Ausländer/Migranten beziehen, ist das ählich. Hier finden sich vier Variablen, mit denen man den Status eines Landkreises mit Bezug auf Ausländer/Migranten recht gut beschreiben kann: (1) Der Anteil von Ausländern an der Bevölkerung des jeweiligen Landkreises, (2) die Netto-Zuwanderung in den jeweiligen Landkreis, (3) die Netto Zuwanderung aus dem Ausland in den jeweiligen Landkreis und (4) die Veränderung des Ausländeranteils in einem Landkreis. Auch die Variablen, die sich zu Alter/Altern finden, sind ausreichend, um einen Landkreis zu beschreiben: Insgesamt finden sich 12 Einzelindikatoren. Fast alles wäre gut, gäbe es nicht den Indikator “Normen und Werte”, der aus mageren zwei Indikatoren besteht: Dem Stimmenanteil der AfD bei der letzten Bundestagswahl und dem Anteil der Katholiken. Das ist nicht nur Unfug, es ist ein klarer Indikator dafür, dass die Indikatoren “Normen und Werte” absichtlich und nachträglich in die Analyse eingefügt wurden, um einen Zusammenhang zwischen AfD-Wahl und Inzidenz von SARS-CoV-2 und COVID-19-Toten aufzuzeigen. Wäre dem nicht so, die Autoren hätten noch den (1) Stimmenanteil der LINKE bei den Bundestagswahlen berücksichtigt, und (2) den Stimmenanteil der CDU bzw. der CSU, und (3) den Stimmenanteil der FDP und (4) die Wahlbeteiligung und (5) die Anzahl der ungültigen Stimmen und den (6) Anteil der Protestanten und (7) den Anteil der Muslime … Sie sehen, wo das hinführt?

Aggregatdatenanalysen sind sehr anfällig für Einzelvariablen. Wenn eine Variable wie der Stimmenanteil der AfD z.B. ein starkes Ost-West-Gefälle aufweist und man keinerlei Kontrollvariablen für andere Parteien nutzt, obwohl sie leicht zu beschaffen gewesen wären, und wenn man dies obwohl bekannt ist, dass im Verlauf des Jahres 2020 die Inzidenzen von West nach Ost gewandert sind, tut, dann kann man diese Entscheidung nur damit erklären, dass hier ein Ergebnis absichtlich manipuliert werden soll. Leider ist das im vorliegenden Fall so und weil dem so ist, ist die Frage der Motivation dieser Studie an dieser Stelle geklärt. Zu all den technischen und methodischen Mängel kommt eine ideologische Schlagseite, die dazu führt, dass man die charakterliche Integrität der Autoren in Frage stellen muss.

Das hindert jedoch nicht daran, in der Datenhuberei nach den Ergebnissen zu suchen, die man vertreten kann, die zwar nicht die Frage beantworten, die die Autoren beantworten wollen: “to identify the key features explaining SARS-CoV-2 infections and COVID-19 deaths during the upswing of the second wave”, denn das können die Autoren nicht mit ihren Daten, die aber einen Hinweis darauf geben können, in welchen Bereichen man nach Erklärungen für die Zunahme von Fallzahl und Toten suchen kann, immer vorausgesetzt, man ist der Ansicht, dass die publizierten Daten zu Fallzahlen und COVID-19 Toten verlässlich und valide sind, eine Annahme, die man nicht unbedingt machen muss, der man sich in jedem Fall als angehender Forscher, wie die drei Nachwuchsforscher aus Rostock und Bonn aber bewusst sein muss.

Die Analysen basieren auf Inzidenzwerten, die vom Robert-Koch-Institut stammen und von den Autoren in fünf Phasen unterteilt werden: 1. bis 15. Oktober 2020, 16. bis 31. Oktober 2020, 1. bis 15. November 2020, 16. bis 30. November 2020 und 1. bis 15 Dezember 2020. Warum diese fünf Phasen? Keine Ahnung. Vermutlich ist diese Einteilung der Tatsache geschuldet, dass die statistische Analyse aufgrund der vielen Variablen die meisten Statistikprogramme an den Rand ihrer Kapazität bringt, weshalb man die Fallzahl reduzieren muss. Wie dem auch sei. Das sind die fünf Phasen, für die in getrennten Rechnungen der jeweilige Zusammenhang der 155 Indikatoren zu SARS-CoV-2-Fallzahlen und COVID-19-Toten bestimmt werden soll. 155 ! Stellen Sie sich eine Auswertung vor, die 155 Einzelindikatoren und zwei abhängige Variablen umfasst. Das kann man zwar abbilden, aber man kann es nicht interpretieren. Man muss die “Komplexität”, wie es so schön heißt, reduzieren. Das tun die drei Autoren, indem sie ihre Analysen auf die 20 Indikatoren beschränken, die jeweils den größten Zusammenhang mit den abhängigen Variablen aufweisen.

Am Ende dieser aus der Not geborenen Vorgehensweise, deren Ziel weniger die Produktion von Ergebnissen als das Gewinnen von Überblick über das, was man an Datenchaos angerichtet hat, ist, präsentieren die Autoren mehr oder weniger Indikatorencluster, die auf EBENE DER LANDKREISE UND KREISFREIEN STÄDTE in einem Zusammenhang mit der SARS-CoV-2-Fallzahl und den COVID-19-Toten der nämlichen Landkreise stehen:

  • Sozioökonomischer Status: Irgendwie gibt es hier einen Zusammenhang, den die Autoren nicht wirklich interpretieren können. Können wir nachvollziehen. Wir wüssten auch nicht aus dem Stand, was es bedeutet, wenn der Wandel in der Langzeitarbeitslosigkeit im Vergleich der Jahre 2012 und 2017 einen Zusammenhang mit den Fallzahlen von positive Getesteten oder an COVID-19 Verstorbenen in einem Landkreis aufweist.
  • Vielleicht ist es ja mit Migration anders? Hier ergibt sich auf Ebene der Landkreise/kreisfreien Städte ein positiver Zusammenhang zwischen dem Ausländeranteil und SARS-CoV-2-Inzidenz und COVID-19 Toten. Je höher ersterer, desto höher letztere. Bedeutet das, dass der Ausländeranteil ein Treiber der Fallzahlen ist? Es kann bedeuten, dass die Inzidenz von SARS-CoV-2 mit dem Ausländeranteil steigt, muss es aber nicht. Wir haben es hier mit Aggregatdaten zu tun, die nur dann etwas über Individuen aussagen, wenn es gelingt, eine Hypothese dafür zu finden, wie sich ein Zusammenhang auf Aggregatebene in Verhalten von Individuen übertragen lässt. Und mit dieser Hypothese ist man nicht am Ende, sondern am Anfang, denn nun muss GEPRÜFT WERDEN, ob diese Hypothese auch zutrifft. Wieder bleibt man zurück und weiß nicht, ob man mehr weiß als man wusste, bevor man von der Existenz dieser Studie wusste.
  • Gesundheit und Pflegebedürftigkeit: Zuerst gibt es keinen Zusammenhang zwischen dem Anteil der Personen in Einrichtungen der Langzeitpflege pro Landkreis und den Fallzahlen (SARS und COVID), dann, als die Fallzahlen gestiegen sind, gibt es einen. Kann man daraus den Schluss ziehen, den die Autoren ziehen, dass es schwierig ist, diejenigen, die durch SARS-CoV-2 besonders gefährdet sind, zu schützen? Nein, man kann die Hypothese ableiten, dass es schwierig sein könnte, gerade die Risikopopulationen zu schützen und muss diese Hypothese dann prüfen, auf Ebene von Individualdaten.

Letztlich geben ökologische Analysen im besten Fall Anhaltspunkte dafür, welche Hypothesen es wert sind, mit Individualdaten getestet zu werden. Zuweilen sind ökologische Analysen auch das einzige Mittel, das man z.B. zur Verfügung hat, um Informationen darüber zu gewinnen, wer die NSDAP gewählt haben könnte. Aber sie ersetzen in keinem Fall die Individualdatenanalyse, die alleine in der Lage ist, Zusammenhänge zu belegen.

Der Status, der der Datenhuberei, über die wir hier berichtet haben, zukommt, ist also bestenfalls der eines Zuträgers von Hypothesen, die dann in weiterer Forschung geprüft werden können. Leider ist den Autoren diese Notwendigkeit nicht bewusst, und sie denken, sie könnten diese Notwendigkeit durch das ersetzen, was ihnen plausibel vorkommt und durch eine Auswahl von Studienergebnissen, die ihnen bekannt sind. Wer will, der kann sich ab “Discussion” (es gibt keine Paginierung) durchlesen, zu welchen Spekulationen eine derartige Vorgehensweise führt. Wissenschaftlich betrachtet ist alles, was die Autoren unter “Discussion” von sich geben, wertlos. Kritisch betrachtet sind es Versuche, die eigene Analyse dadurch ad absurdum zu führen, dass der Zusammenhang zwischen Ausländeranteil und Fallzahlen mit einem Verweis darauf, dass Ausländer “often work in occupations such as cleaners, food production workers, or elderly care…and therefor are more exposed to the virus”, zurückzuführen sei, eine aktuell gefundene Korrelation also durch eine wilde Spekulation beseitigt werden soll, an der zumindest die Türken der zweiten und dritten Generation, man denke nur an Herrn Cem Özdemir, wohl erheblichen Abstoß nehmen würden, also jene Generation von Türken, die sich als Unternehmer selbständig, als Dozent an Hochschulen, Polit-Darsteller bei den Grünen, bei Banken und Versicherungen und Verwaltungen, überall, nur nicht in der Putzkolonne findet, die deutsch-polnisch zusammengesetzt ist. Aber, wenn es darum geht, ideologisch unerwünschte Ergebnisse wegzuerklären, dann sind der Phantasie keine Grenzen gesetzt, ebenso wie die Phantasie grenzenlos ist, wenn es darum geht, das Ergebnis, dass der “Stimmenanteil, den die AfD bei der Bundestagswahl 2017” in einem Landkreis erhalten hat, in einem positiven Zusammenhang mit SARS-Fallzahlen und COVID-Toten steht, zu legimitieren.

Der Zusammenhang ist Unfug, warum, das haben wir oben schon dargelegt. Aber dass etws Unfug ist, das hindert Ideologen nicht, es zu begründen. Der Stimmenanteil der AfD bei der Bundestagswahl im Jahre 2017 gilt den Autoren als Indikator dafür, ob oder ob nicht sich Individuen an die Lockdown-, Masken- und Abstandsregeln halten und damit sind sie nicht am Ende. 61% von Leuten, die heute sagen, sie würden die AfD wählen, wenn am nächsten Sonntag Wahl wäre und sie seien zudem für ein Ende der Lockdown-Maßnahmen, gelten den Autoren als Beleg dafür, dass sich AfD-Wähler nicht an Corona-Regelungen halten.

Eigentlich muss man zu einem solchen Blödsinn nicht wirklich etwas sagen.
Tun wir es trotzdem.

Ihr habt Aggregatdaten, ihr Hirnis:

  • Die Leute, die 2017 die AfD in einem Landkreis gewählt haben, sind nicht die Leute, die heute befragt werden.
  • Die Leute, die 2017 die AfD in einem Landkreis gewählt haben, stehen zu den Leuten, die sich in einem Landkreis NICHT an Regelungen zur Eindämmung von SARS-CoV-2 halten in einem UNBEKANNTEN ZUSAMMENHANG.
  • Die Leute, die 2017 die AfD in einem Landkreis gewählt haben, stehen zu den Leuten, die sich im Verlauf der zweiten Hälfte des Jahres 2020 mit SARS-CoV-2 infiziert haben oder an COVID-19 verstorben sind, in einem UNBEKANNTEN ZUSAMMENHANG.

Was die Autoren hier tun, ist Brunnenvergiftung, mit einer ideologischen Ankriechleistung, die vielleicht Wohlwollen bei Ideologen hervorruft, aber Abscheu bei all denen zur Folge hat, die sich wissenschaftlicher Erkenntnis verschrieben haben. Um fair zu sein, Letztere finden sich an Hochschulen nur noch als spärlicher Rest. Es mag für Nachwuchswissenschaftler, die nicht den Mut haben, auf eigenen Füßen zu stehen, eine Strategie sein, sich bei den Ideologen, die über Forschungsmittel und Professuren entscheiden, anzudienen, ihnen in den Allerwertesten zu kriechen. Aber man muss dann zu seiner Entscheidung stehen, die Wissenschaft für ein Leben in ideologischem Müll verlassen zu haben.

Dobelhammer, Gabriele, Reinke, Constantin & Kreft, Daniel (2021). The second wave of COVID-19 incidence and death in Germany – driven by values, social status and migration background? A county-scale explainable machine learning approach. medRxiv.

Wichtig, um nachzuvollziehen, was hier getan wurde: Die Supplementary Materials.



Seit Ende Januar 2020 besprechen wir Studien zu SARS-CoV-2. Damit gehören wir zu den wenigen, die das neue Coronavirus seit seinem Auftauchen verfolgt und den Niederschlag, den es in wissenschaftlichen Beiträgen gefunden hat, begleitet haben.
Eine Liste aller Texte, die wir zu SARS-CoV-2 veröffentlicht haben, finden Sie hier.

Gutes, so hieß es früher, muss nicht teuer sein. Aber auch ein privates Blog muss von irgend etwas leben.

Deshalb unsere Bitte: Tragen Sie mit einer Spende dazu bei, dass wir als Freies Medium weiterbestehen.

Vielen Dank!

  • Deutsche Bank 
  • Michael Klein
  • BIC: DEUTDEDBCHE
  • IBAN: DE18 8707 0024 0123 5191 00
  • Tescobank plc.
  • ScienceFiles / Michael Klein
  • BIC: TPFGGB2EXXX
  • IBAN: GB40 TPFG 4064 2010 5882 46


Bleiben Sie mit uns in Kontakt.
Wenn Sie ScienceFiles abonnieren, erhalten Sie bei jeder Veröffentlichung eine Benachrichtigung in die Mailbox.

Print Friendly, PDF & Email





Source link

Von Veritatis