Korrelation
Statistik
© 2016
- 2025
Definition|
Einführung|
Die statistische Abhängigkeit|
Der Unterschied zur Korrelationszahl|
Was ist eine Proxy-Variable?|
Fußnoten
Definition
Eine Korrelation in der Statistik ist eine Zahl, die angibt, wie stark zwei Größen statistisch voneinander abhängig sind. Umgangssprachlich gesagt: wie oft sie gemeinsam auftreten.
Einführung
Wenn eine Zahl durch 6 teilbar ist, dann ist sie immer auch durch 3 teilbar.[3] Die Zahl 30 zum Beispiel kann man ohne Rest durch 6 und auch ohne Rest durch 3 teilen. Die Teilbarkeit durch 6 und die Teilbarkeit durch 3 hängen sehr eng zusammen, sie korrelieren zu 100 %. Weniger offensichtlich wäre aber zum Beispiel die Korrelation des Auftretens von Sonnenflecken und dem Preis von Weizen in England:
ZITAT:
Wilhelm (William) Herschel, 1801: "Das Ergebnis dieser Betrachtungen der vorangehenden fünf Zeiträume ist, dass ausgehend vom Preis für Weizen, es wahrscheinlich scheint, dass ein vorübergehender Mangel an Wachstum stattgefunden hat, und zwar genau dann, wenn man die Sonne ohne jene Erscheinungen [die Sonnenflecken] war, welche wir als Symptome als ausgiebiger Emissionen von Licht und Hitze verdächtigen."[4]
Wilhelm (William) Herschel, 1801: "Das Ergebnis dieser Betrachtungen der vorangehenden fünf Zeiträume ist, dass ausgehend vom Preis für Weizen, es wahrscheinlich scheint, dass ein vorübergehender Mangel an Wachstum stattgefunden hat, und zwar genau dann, wenn man die Sonne ohne jene Erscheinungen [die Sonnenflecken] war, welche wir als Symptome als ausgiebiger Emissionen von Licht und Hitze verdächtigen."[4]
Der in Hannover geborene[5] spätere britische Astronom Wilhelm (William) Herschel (1738 bis 1822) stellt hier eine sehr interessante Beobachtung an: wenn der Preis für Weizen hoch ist, dann scheint man daraus schließen zu können, dass es in der entsprechenden Wachstumsperiode auf der Sonne weniger Sonnenflecken gab. Doch "wie eng" ist der Zusammenhang? Gab es immer, bei hohen Weizenpreisen vorher weniger Sonnenflecken? Und gilt der Umkehrschluss: bei niedrigem Weizenpreis gab es mehr Sonnenflecken? Um die Stärke solcher vermuteten Korrelationen angeben zu können, gibt es die Korrelations- oder Zusammenhangsmaße.
Die statistische Abhängigkeit
Politisch sehr brisant: mitten in der Corona-Pandemie aus den Jahre 2019 bis 2022 stellt man für die Landkreise in Deutschland einen auffällig engen Zusammenhang zwischen explodierenden Corona-Erkrankungen und den Wahlerfolgen der Partei AfD fest[2][3]. Das Wort statistische Abhängigkeit bezeichnet steht nur für die Unterscheidung ja/nein bezüglich einer solchen Verbindung zweier Größen. Wie stark die Abhängigkeit ist, wie damit noch nicht gesagt. Lies mehr unter statistische Abhängigkeit ↗
Der Unterschied zur Korrelationszahl
Die statistische Abhängigkeit gibt nur an, ob es einen Zusammenhang gibt oder nicht. Sie sagt nicht, wie stark dieser Zusammenhang. Dazu dienen die verschiedenen Korrelationskoeffizienten, auf Deutsch Zusammenhangsmaße ↗
Was ist eine Proxy-Variable?
Es ist heute unmöglich, direkt die durchschnittliche Jahrestemperatur der Erde für das Jahr 1066 zu messen. Da man aber beobachtet hat, dass die Einlagerung bestimmter Isotope von Sauerstoff in polares Eis eng mit der Lufttemperatur korreliert, kann man bestimmte Isotopenverhältnisse aus Luftblasen in Bohrkernen alter Eismassen als Stellvertreter-Variable benutzen. Wichtig ist, dass die Stellvertreter-Variable (Isostopenverhältnis) eng mit der interessierenden Zielgröße (Lufttemperatur) korreliert. Eine solche Stellvertreter-Variable nennt man auch eine Proxy-Variable ↗
Fußnoten
- [1] Eric Beltermann et al.: Hängen AfD-Hochburgen und hohe Coronazahlen zusammen? In: Der Tagesspiegel. Online. 20. Dezember 2020.
- [2] Christoph Richter, Maximilian Wächter, Jost Reinecke, Axel Salheiser, Matthias Quent, Matthias Wjst: Politische Raumkultur als Verstärker der Corona-Pandemie? Einflussfaktoren auf die regionale Inzidenzentwicklung in Deutschland in der ersten und zweiten Pandemiewelle 2020. Erweiterte Fassung. In: Budrich Journals. ZRex Zeitschrift für Rechtsextremismusforschung. Online: https://budrich-journals.de/index.php/zrex/article/view/38136
- [3] Zu den Teilbarkeiten durch sechs und durch drei: die Zahlen 6, 12, 18, 24 und so weiter sind alle ohne Rest durch 6 teilbar. Und sie sind auch alle ohne Rest durch 3 teilbar. Die Korrelation der Teilbarkeiten ist hier sehr eng. Siehe mehr zur Mathematik im Artikel Teilbarkeit ↗
- [4] Im Jahr 1801 vermutete der Astronom Wilhelm (William) Herschel, dass es eine Korrelation zwischen der Intensität von Sonnenflecken und dem Preis von Weizen in England geben könnte. Die Übersetzung stammt von mir, das englische Original ist: “The result of this review of the foregoing five periods is, that, from the price of wheat, it seems probable that some temporary scarcity or defect of vegetation has generally taken place, when the sun has been without those appearances which we surmise to be symptoms of a copious emission of light and heat.” In: Sir William Herschel: Philosophical Transactions of the Royal Society of London. Band 91, 1801, S. 265
- [5] Als Wilhelm Herschel im Jahr 1738 in Hannover geboren wurde, war die Stadt mit ihren umliegenden Besitzungen in Personalunion mit Großbritannien verbunden. Seit dem Jahr 1714 wurde England von Königen des Hauses Hannover regiert.