Vierfeldertafel Aufbau Basiswissen In der Statistik und Stochastik werden sogenannte Vierfeldertafeln, auch Kreuz- oder Kontingenztabelle genannt, genutzt, um Beziehungen von Objekten mit zwei Merkmalen mit je zwei Ausprägungen übersichtlich darzustellen. Das ist hier ausführlich erklärt. Wie sieht eine Vierfeldertafel aus? Eine Vierfeldertafel ist eine Art Tabelle. Sie hat immer vier Zeilen (links nach rechts). Sie hat immer vier Spalten (oben nach unten). Siehe auch Spalte ↗ Siehe auch Zeile ↗ Was sind Merkmale und Ausprägungen? Bei einer Vierfeldertafel geht es immer um irgendwelche Dinge oder Objekte, die man in der Statistik Merkmalsträger nennt. Merkmalsträger können zum Beispiel Menschen, Tiere, Planeten, Münzen oder sonst irgendetwas sein. Diese Dinge haben Eigenschaften, die man dann Merkmale nennt. Eigenschaften wären zum Beispiel: Gewicht, Farbe, Alter, Preis, Durchmesser udn so weiter. Jedes Merkmal kann verschiedene Ausprägungen haben. Merkmalsausprägungen von Gewicht könnten zum Beispiel sein: 200 g, 5 kg, eine Tonne. Aber auch einfach "leicht" oder "schwer" wären Merkmalsausprägungen von Gewicht. Diese Merkmalsausprägungen werden oft mit Großbuchstaben wie A und B abgekürzt. Ein Buchstabe ohne Querstrich darüber meint dann, dass ein Ding die Merkmalsausprägung hat. Mit Querstrich meint man, dass es die Ausprägungen nicht hat. Für das Gewicht "leicht" könnte man also zum Beispiel L und für das Gewicht "schwer" das L mit dem Querstrich (meint: nicht schwer) nehmen. Bei einer Vierfeldertafel betrachtet man ausschließlich Merkmale mit genau zwei Ausprägungen (leicht/schwer, grün/nicht-grün). Siehe auch unter dichotomes Merkmal ↗ Wie ist die Vierfeldertafel aufgebaut? Die Vierfeldtafel ist eine Tabelle. Sie hat vier Zeilen und vier Spalten. Spalten gehen von oben nach unten. Zeilen gehen von links nach rechts. Erste Zeile, ganz links: Das Wort "Merkmal". Erste Zeile, zweites Feld: A ohne Strich. Erste Zeile, drittes Feld: A mit Strich Erste Zeile, ganz rechts: Das Wort "Summe" Zweite Zeile, ganz links: B ohne Strich Zweite Zeile, zweites Feld: Anzahl von Dingen mit A und B Zweite Zeile, drittes Feld: Anzahl von Dingen ohne A aber mit B Zweite Zeile, ganz rechts: Anzahl von Dingen mit B (Summe) Dritte Zeile, ganz links: B mit Strich Dritte Zeile, zweites Feld: Anzahl von Dingen ohne B aber mit A Dritte Zeile, drittes Feld: Anzahl von Dingen ohne B und ohne A Dritte Zeile, ganz rechts: Anzahl von Dingen ohne B (Summe) Vierte Zeile, ganz links: Das Wort "Summe" Vierte Zeile, zweites Feld: Anzahl von Dingen mit A (Summe) Vierte Zeile, drittes Feld: Anzahl von Dingen ohne A (Summe) Vierte Zeile, ganz rechts: Gesamtzahl von Dingen (Gesamtsumme) Was ist der Unterschied zwischen absoluter und relativer Häufigkeit? Vierfeldertafeln kann man mit absoluten Häufigkeiten H oder mit relativen Häufigkeiten h erstellen. Bei den absoluten Häufigkeiten nimmt man für die Felder immer das, was direkt beim Zählen herauskommt. Statt absoluter Häufigkeit kann man auch kurz "Anzahl" sagen. Man kann zum Beispiel 100 Haselnüsse auf die Merkmalsausprägungen "leicht/schwer" und "groß/klein" hin untersuchen. Wenn dann zum Beispiel 20 Nüsse sowohl groß als auch leicht sind, dann wäre die absolute Häufigkeit großer leichter Nüsse "20". Die relative Häufigkeit aber wäre 0,2 oder in Prozenten 20 %. Man kann die VFT entweder nur mit absoluten oder nur mit relativen Häufigkeiten ausfüllen. Man darf die Häufigkeitsarten aber nicht in einer Tabelle mischen. H ist die absolute Häufigkeit ↗ h ist die relative Häufigkeit ↗ Welche Summenregeln gelten immer? Die Summe der vier Innenfelder gibt immer die Zahl ganz unten rechts. Die Summe der zwei mittleren Felder ganz rechts gibt immer die Zahl ganz unten rechts. Die Summe der zwei mittleren Felder ganz unten gibt immer die Zahl ganz unten rechts. Was gilt speziell für relative Häufigkeiten? Relative Häufigkeiten meint: Anteile vom Ganzen wie etwa 0,15. Relative Häufigkeiten kann man auch in % angeben, etwa 15 %. Alle relativen Häufigkeiten beziehen sich auf die Gesamtzahl aller Dinge. Es sind also immer Anteile bzw. Prozente von der Zahl ganz unten rechts. Im Feld ganz unten rechts muss immer eine 1 oder die 100 % stehen. Was gilt für statistisch (un)abhängige Merkmale? Jedes der vier Innenfelder ist gleich dem Produkt der zwei zugehörigen Außenfelder: Zweite Zeile ganz rechts mal Zweite Spalte ganz unten = Zweite Zeile, zweites Feld Zweite Zeile ganz rechts mal Dritte Spalte ganz unten = Zweite Zeile, dritte Spalte Dritte Zeile ganz rechts mal Zweite Spalte ganz unten = Dritte Zeile, zweite Spalte Dritte Zeile ganz rechts mal Dritte Spalte ganz rechts = Dritte Zeile, dritte Spalte Gilt keine der vier Formeln, sind die Merkmale statistisch unabhängig. Gilt eine Formel nicht, sind die Merkmale statistisch abhängig. Mehr unter Titanicliste und statistische Abhängigkeit ↗ Ein Versuch zur bedingten Wahrscheinlichkeit Die Themen statistische Abhängigkeit (Statistik) und bedingte Wahrscheinlichkeit (Stochastik) sind sehr eng verwandt. Ein stochastischer Versuch zur bedingten Wahrscheinlichkeit mit einer Vierfeldertafel als Auswertung steht unter Bayes-Schüssel-Versuch (Vierfeldertafel) ↗ Ganz oben sieht man eine Zeichnung der Titanic. artbejo on www.openclipart.org Gunter Heim Bedingte Wahrscheinlichkeit aus Vierfeldertafel Statistische Abhängigkeit über Vierfeldertafel Titanicliste und statistische Abhängigkeit Bayes-Schüssel-Versuch (Vierfeldertafel) Vierfeldertafel aus Baumdiagramm Baumdiagramm aus Vierfeldertafel Titanicliste [Beispiel-Daten] Dichotomes Merkmal Merkmal Ausprägung Tabelle Zeile Spalte Tafel Stochastik Statistik Vierfeldertafel auf Wikipedia Zurück zur Startseite