Glaube keiner Statistik, …

Glaube keiner Statistik, …

… die du nicht verstehst.

Als Mensch mit einer wissenschaftlichen Ausbildung ärgere ich mich immer wieder über reißerische Schlagzeilen in der Art „Theatergänger leben länger“ oder „Menschen, die alleine leben, bekommen häufiger psychische Erkrankungen“. Dabei wird ein kausaler Zusammenhang zumindest suggeriert: „Weil die Leute häufiger ins Theater gehen, leben sie länger“ oder „Allein zu leben führt zu psychischen Erkrankungen“.

Manchmal werden die Behauptungen dann im weiteren Text etwas relativiert. Die Behauptungen werden in Frageform formuliert. Oder es ist dann davon die Rede, dass es Hinweise gibt und dass natürlich noch weitergehende Studien erforderlich sind. In vielen Beiträgen wird als untersuchte Stichprobe eine sehr geringe Zahl genannt. Spätestens dann schmälert sich die Aussagekraft solcher „Studien“ in Richtung belanglos.

Die wahre Story vom Storch

Damit Sie sich künftig von solchen Studien nicht mehr beindrucken lassen, möchte ich anhand der „Story vom Storch“ kurz erläutern, was es bedeuten kann, wenn statistische Zusammenhänge entdeckt werden. Vor einigen Jahrzehnten konnte man tatsächlich beobachten, dass die Storchenpopulation in bestimmten Gegenden rückläufig ist und dass gleichzeitig die Zahl der Neugeborenen zurückgeht. Es gibt also ganz eindeutig einen statistischen Zusammenhang bzw. eine Korrelation zwischen der Anzahl der Störche und der Anzahl der Kinder. Heißt das nun, dass die Babys doch vom Storch gebracht werden? Natürlich nicht.

Solche Korrelationen bedeuten nur, dass sich die Zahlen in gleicher Weise verändern. Trägt man die einzelnen Messwerte in ein Koordinatensystem ein, ergibt sich eine Punktwolke, wie die folgende Abbildung zeigt.

Korrelation - Koordinaten

Die Kreuzchen stellen jeweils Störche und Neugeborene in unterschiedlichen Regionen dar. Eine statistisch hohe Korrelation zeichnet sich dadurch aus, dass sich durch die Punktwolke eine Gerade zeichnen lässt, um die die einzelnen Messwerte nur gering streuen. Liegen sämtliche Messwerte genau auf der Geraden, würde eine vollständige Korrelation herrschen. Es wäre dann beispielsweise möglich, die Anzahl der Störche (y) in einer Region exakt zu bestimmen, indem man die Anzahl der Neugeborenen zählt (x). Je weiter aber die Messwerte um die Gerade der vollständigen Korrelation streuen, desto gröber und fehlerträchtiger wären solche Schätzungen.

Ursache und Wirkung

Hat man nun eine hohe Korrelation zwischen zwei nummerischen Größen wie Störchen und Neugeborenen festgestellt, will man natürlich verstehen, wie dieser Zusammenhang zustande kommt. Was ist Ursache, was ist Wirkung? Theoretisch gibt es 5 Möglichkeiten:

  1. Die Störche bringen die Kinder, sind also die direkte Ursache für den menschlichen Nachwuchs.
  2. Es könnte aber auch genau umgekehrt sein: Die Neugeborenen sorgen für eine hohe Population der Störche. Würde man die künstlichen Störche mitzählen, die als Zeichen für den Nachwuchs aufgestellt werden, würde dieser Zusammenhang sogar zutreffen.
  3. Es gibt eine Wechselwirkung, das heißt eine gegenseitige Abhängigkeit voneinander. Dies wäre zum Beispiel der Fall, wenn man Häufigkeit von bestimmten Insekten und Pflanzen miteinander vergleicht.
  4. Es gibt keinen direkten kausalen Zusammenhang zwischen den Messgrößen, Beide hängen aber von einer gemeinsamen Ursache ab, nämlich dem Grad der Industrialisierung: Je stärker die Industrialisierung fortgeschritten ist, desto weniger Lebensräume gibt es für Störche und desto weniger Kinder werden geboren. Dies ist die richtige Erklärung.
  5. Schließlich ist es auch möglich, dass es überhaupt keinen kausalen Zusammenhang gibt, und dass sich die Zahlen nur zufällig in gleicher Weise entwickeln. Wenn zum Beispiel der Fernsehkonsum in China steigt und gleichzeitig die Anzahl der Qualitätsmängel an deutschen Produkten, dürfte es schwer fallen, einen kausalen Zusammenhang herzustellen.

Als Fazit bleibt festzuhalten: „Statistiken sind mit Vorsicht zu genießen und mit Verstand einzusetzen.“ (Carl Hahn, *1926, ehemaliger Vorstandsvorsitzender der Volkswagen AG).

 

Autor: Josef Maiwald

Quellen

Josef Maiwald: Informationsfluten managen, 2001

Top