R


Korrelation


Statistik


Definition


Eine Korrelation in der Statistik ist eine Zahl, die angibt, wie stark zwei Größen statistisch voneinander abhängig sind. Umgangssprachlich gesagt: wie oft sie gemeinsam auftreten. Das ist hier kurz vorgestellt.

Die statistische Abhängigkeit


Politisch sehr brisant: mitten in der Corona-Pandemie aus den Jahre 2019 bis 2022 stellt man für die Landkreise in Deutschland einen auffällig engen Zusammenhang zwischen explodierenden Corona-Erkrankungen und den Wahlerfolgen der Partei AfD fest[2][3]. Das Wort statistische Abhängigkeit bezeichnet steht nur für die Unterscheidung ja/nein bezüglich einer solchen Verbindung zweier Größen. Wie stark die Abhängigkeit ist, wie damit noch nicht gesagt. Lies mehr unter statistische Abhängigkeit ↗

Der Unterschied zur Korrelationszahl


Die statistische Abhängigkeit gibt nur an, ob es einen Zusammenhang gibt oder nicht. Sie sagt nicht, wie stark dieser Zusammenhang. Dazu dienen die verschiedenen Korrelationskoeffizienten, auf Deutsch Zusammenhangsmaße ↗

Was ist eine Proxy-Variable?


Es ist heute unmöglich, direkt die durchschnittliche Jahrestemperatur der Erde für das Jahr 1066 zu messen. Da man aber beobachtet hat, dass die Einlagerung bestimmter Istope von Sauerstoff in polares Eis eng mit der Lufttemperatur korreliert, kann man bestimmte Isotopenverhältnisse aus Luftblasen in Bohrkernen alter Eismassen als Stellvertreter-Variable benutzen. Wichtig ist, dass die Stellvertreter-Variable (Isostopenverhältnis) eng mit der interessierenden Zielgröße (Lufttemperatur) korreliert. Eine solche Stellvertreter-Variable nennt man auch eine Proxy-Variable ↗

Fußnoten