Betrachtung der Realität aus Betrachtung der Realität aus der Sicht der Statistik der Sicht der Statistik TABELLEN UND TABELLEN UND HÄUFIGKEITSVERTEILUNGEN HÄUFIGKEITSVERTEILUNGEN Scuola Secondaria 1°grado; Argomento: Leggiamo - Tabelle (30.09.13); Pacchetto: S1.A.3 Übersetzung: / Tradotto da:
25
Embed
Betrachtung der Realität aus der Sicht der Statistik TABELLEN UND HÄUFIGKEITSVERTEILUNGEN Scuola Secondaria 1°grado; Argomento: Leggiamo - Tabelle (30.09.13);
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Betrachtung der Realität aus Betrachtung der Realität aus der Sicht der Statistik der Sicht der Statistik
TABELLEN UND TABELLEN UND HÄUFIGKEITSVERTEILUNGENHÄUFIGKEITSVERTEILUNGEN
Scuola Secondaria 1°grado; Argomento: Leggiamo - Tabelle (30.09.13); Pacchetto: S1.A.3
Übersetzung: / Tradotto da:
INHALT
1) Häufigkeitstabellen mit Prozentwerten
2) Absolute Häufigkeitstabelle: Erstellung
3) Vergleichbarkeit von Verteilungen
4) Konzeptualisierung einfache Verteilung
5) Kreuztabellen
6) Konzeptualisierung doppelte Verteilung
Tab. 1 – Personen im Alter von 6 Jahren und mehr nach Häufigkeit der Internetnutzung Jahr 2012 (je 100 Personen mit 6 Jahren und mehr)
Häufigkeit der InternetnutzungPersonen mit 6
Jahren und mehrJeden Tag 29,5Einmal oder mehrmals in der Woche 18,7Ein paar Mal im Monat 3,3Ein paar Mal im Jahr 1,0nie 45,6Keine Angabe 1,9Insgesamt 100,0
Quelle: Istat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012
Häufigkeitstabellen mit Prozentwerten
Die Tabelle mit prozentuellen Häufigkeiten ist am weitesten verbreitet, da sie leicht verständlich ist: Die Werte werden mit dem Gesamten in Beziehung gesetzt (das gleich 100 ist).
Wie liest man die Tabelle?
Tab. 1 – Personen im Alter von 6 Jahren und mehr nach Häufigkeit der Internetnutzung Jahr 2012 (je 100 Personen mit 6 Jahren und mehr)
Häufigkeit der InternetnutzungPersonen mit 6
Jahren und mehrJeden Tag 29,5Einmal oder mehrmals in der Woche 18,7Ein paar Mal im Monat 3,3Ein paar Mal im Jahr 1,0nie 45,6Keine Angabe 1,9Insgesamt 100,0
Quelle: Istat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012
Häufigkeitstabellen mit Prozentwerten: lesen
Berücksichtigt man die gesamte italienische Bevölkerung im Alter von 6 Jahren und mehr, sagt uns die Tabelle zum Beispiel das…
… 45,6% das Internet nicht
nutzen
… fast 30% der Bevöl-kerung das Internet jeden Tag verwenden
Wie erstellt man die Tabelle?
Häufigkeitstabellen mit Prozentwerten: erstellen
Personen mit 6 Jahren und mehr
(je 1 Person mit 6 Jahren und mehr)
16.819 / 57.019
10.640 / 57.019
1.871 / 57.019
597 / 57.019
26.008 / 57.019
1.084 / 57.019
57.019 / 57.019
Personen mit 6 Jahren und mehr
(je 100 Personen mit 6 Jahren und mehr)
16.819 / 57.019 x 100
10.640 / 57.019 x 100
1.871 / 57.019 x 100
597 / 57.019 x 100
26.008 / 57.019 x 100
1.084 / 57.019 x 100
57.019 / 57.019 x 100
Häufigkeit der Internetnutzung
Personen mit 6 Jahren und mehr
(Werte in 1.000)
Jeden Tag 16.819 Einmal oder mehrmals in der Woche 10.640 Ein paar Mal im Monat 1.871 Ein paar Mal im Jahr 597 nie 26.008 Keine Angabe 1.084 Insgesamt 57.019
Quelle: Istat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012
Tab. 2 - Personen im Alter von 6 Jahren und mehr nach Häufigkeit der Internetnutzung - Jahr 2012
a) Man berücksichtigt absolute Häufigkeitstabelle
c) Man berechnet die prozentuellen Häufigkeiten
b) Man berechnet die relativen HäufigkeitenDie absolute Häufigkeit gibt
an, wie oft sich die Ausprägung eines Merkmals
in der Grundgesamtheit wiederholt
Die relative Häufigkeit ist das Verhältnis
zwischen absoluter Häufigkeit und
SummeDie prozentuelle Häufigkeit ist die
relative Häufigkeit multipliziert mit
100
Die Tabelle mit den relativen und prozentuellen Häufigkeiten erhält man ausgehend von der absoluten Häufigkeitstabelle.Wie erhält man aber die absolute Häufigkeitstabelle?
Absolute Häufigkeitstabelle: erstellen (1/4)
Die absolute Häufigkeitstabelle erhält man ausgehend von der Verteilung nach Einheit: für jede Einheit wird die Ausprägung des Merkmals angegeben.
Absolute Häufigkeitstabelle: erstellen (2/4)
In Excel mit der Schaltfläche fx (Funktion einfügen) die Funktion „Zählenwenn“ auswählen und mit Ok bestätigen.
Absolute Häufigkeitstabelle: erstellen (3/4)
Den Zellbereich eingeben, der gezählt werden soll, und die Suchkriterien, also die Bedingung, mit der die Zellen definiert werden, die gezählt werden sollen. Dann mit Ok bestätigen.
Absolute Häufigkeitstabelle: erstellen (4/4)
So erhält man die absoluten Häufigkeiten (dieselben wie in Tabelle 2).
In Excel lassen sich die relativen Häufigkeiten
berechnen:
und die prozentuellen Häufigkeiten:
So erhält man alle Berechnungen, die in
Tabelle 2 gemacht wurden:
Vergleichbarkeit von Verteilungen (1/2)
Frage: wie stark ist die tägliche Internetnutzungzwischen 2009 und 2012 gestiegen?Tab. 3 - Personen mit 6 Jahren und mehr nach Häufigkeit der Internetnutzung (Werte in 1.000)
Häufigkeit der Internetnutzung
Personen mit 6 Jahren und mehr
Jahr 2009 Jahr 2012
Jeden Tag 12.251 16.819 Einmal oder mehrmals in der Woche 9.632 10.640 Ein paar Mal im Monat 2.233 1.871 Ein paar Mal im Jahr 864 597 Nie 29.540 26.008 Keine Angabe 1.712 1.084 Insgesamt 56.232 57.019
Quelle: Istat, I.Stat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012
… aber der Vergleich ist ungültig, da die beiden Grundgesamtheiten unterschiedlich groß sind.
Der Vergleich der Verteilungen der absoluten Häufigkeiten ergibt, dass die Zahl der Personen im Alter von 6 Jahren und mehr von 12.251 Tausend im Jahr 2009 auf 16.819 Tausend im Jahr 2012 gestiegen ist…
Vergleichbarkeit von Verteilungen (2/2)
Um Vergleiche zu ziehen, müssen die Verteilungen der relativen oder prozentuellen Häufigkeiten verwendet werden, wo jede Grundgesamtheit gleich groß ist.
Der Vergleich der Verteilungen der prozentuellen Häufigkeiten erlaubt die Aussage, dass im Jahr 2009 21,8 von 100 Personen im Alter von 6 Jahren und mehr täglich das Internet genutzt haben (also 21,8 Prozent). 2012 haben 29,5 von 100 Personen im Alter von 6 Jahren und mehr täglich das Internet genutzt (also 29,5 Prozent).
Tab. 4 - Personen mit 6 Jahren und mehr nach Häufigkeit der Internetnutzung (je 100 Personen mit 6 Jahren und mehr)
Häufigkeit der Internetnutzung Personen mit 6 Jahren und mehr
Jahr 2009 Jahr 2012
Jeden Tag 21,8 29,5 Einmal oder mehrmals in der Woche 17,1 18,7 Ein paar Mal im Monat 4,0 3,3 Ein paar Mal im Jahr 1,5 1,0 Nie 52,5 45,6 Keine Angabe 3,0 1,9 Insgesamt 100,0 100,0
Quelle: Istat, I.Stat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012
Konzeptualisierung der einfachen Verteilung in der Sprache der Statistiker…
Die Summe der absoluten Häu-figkeiten ent-
spricht der Grund-
gesamtheit
Die Summe der prozentuellen
Häufigkeiten ist 100
Die Summe der relativen Häufigkeiten
ist 1
Carattere XFrequenze
assoluteFrequenze
relativeFrequenze
percentuali
Modalità x1
Modalità x2
. . . .
Modalità xi
. . . .
Modalità xk
Totale 1 100
f1ൌ�� ଵn1 p1ൌ��
ଵ כ ͳͲͲ
f2ൌ�� ଶ
fiൌ��
fkൌ��
p2ൌ�� ଶ כ ͳͲͲ
piൌ�� כ ͳͲͲ
pkൌ�� כ ͳͲͲ
n2
ni
nk
n
Tab. 5 – Einfache Häufigkeitsverteilung
Schauen wir uns die Summen
an…
Tabellen-kopf
Spalte mit Ausprägungen
Die Sprache der Statistiker verwendet bestimmte Symbole…
Kreuztabelle
Es gibt 2 Merk-male
Tab. 6 – Personen mit 6 Jahren und mehr nach Häufigkeit der Internetnutzung und Region Jahr 2012 (je 100 Personen mit 6 Jahren und mehr in derselben Region)
Schauen wir uns an einem Beispiel an, wie man die Tabelle liest
Quelle: Istat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012
Kreuztabelle: lesen
45,6% der Bevölkerung Italiens mit 6 Jahren und mehr nutzt nicht das Internet…… aber es gibt große räumliche Unterschiede
Tab. 6 - Personen mit 6 Jahren und mehr nach Häufigkeit der Internetnutzung und Region Jahr 2012 (je 100 Personen mit 6 Jahren und mehr in derselben Region)
Quelle: Istat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012
Kreuztabelle: erstellen (2/5)
In Excel: im Menü Einfügen Pivottabelle auswählen. Es öffnet sich das Fenster «Pivottabelle erstellen», in dem Folgendes spezifiziert werden muss: a) die Daten, die analysiert werden (gesamte Datenmatrix auswählen), b) wo der PivotChart-Bericht positioniert wird. Dann auf ok klicken.
Doppelte Verteilung je Einheit: für jede Einheit die Ausprägungen von zwei Merkmalen:
Kreuztabelle: erstellen (3/5)
Aus PivotTable-Feldliste die Felder in die untenstehenden Bereiche ziehen: Spaltenbeschriftung – Zeilenbeschriftung - Werte.
Kreuztabelle: erstellen (4/5)
Um die Tabelle 7 zu nachzubauen: ‘Internetnutzung’ in die Spaltenbeschriftungen ziehen, ‘Region’ in die Zeilenbeschriftungen und ‘Einheit’ in das Feld Werte (Einstellungen Feld Werte – Zusammenfassung Werte nach - Zählung)
Kreuztabelle: erstellen (5/5)
Um die Tabelle 6 nachzubauen: ‘Internetnutzung’ in die Spaltenbeschriftungen ziehen, ‘Region’ in die Zeilenbeschriftungen und ‘Einheit’ in das Feld Werte (Einstellungen Feld Werte – Zusammenfassung Werte nach - Zählung; zeige Werte als % der Zeilensumme)
Konzeptualisierung doppelte Verteilung in der Sprache der Statistiker… (1/4)
nij ist die Häufigkeit der Einheiten, bei denen das
Merkmal X in der Ausprägung xi und das Merkmal Y in der
Ausprägung yj vorhanden ist.
Tabellen-kopf
Spalte mit
Ausprä-gungen
z Ausprägung des Merkmals y
Modalità y1 Modalità y2 . Modalità yj . Modalità yz
Modalità x1 . .
Modalità x2 . .
. . . . .
Modalità xi . .
. . . . .
Modalità xk . .
Totale . .
Carattere XCarattere y
Totale
n11
n21
ni1
nk1
n01
n12
n22
ni2
nk2
n02
n1j
n2j
nij
nkj
n0j
n1z
n2z
niz
nkz
n0z
n10
n20
ni0
n
nk0
n0j ist die Häufigkeit der Einhei-ten, bei denen das Merkmal Y in der Ausprägung yj vorhanden ist
ni0 ist die Häufigkeit der Einheiten, bei
denen das Merkmal X in der Ausprä-
gung xi
vorhanden ist
n ist die Anzahl der
Grund-gesamtheit
Tab. 8 – Doppelte Verteilung der absoluten Häufigkeiten
Modalità y1 Modalità y2 . Modalità yj . Modalità yz
Modalità x1 . .
Modalità x2 . .
. . . . .
Modalità xi . .
. . . . .
Modalità xk . .
Totale . .
Carattere XCarattere y
Totale
p11
p21
pi1
pk1
p01
p12
p22
pi2
pk2
p02
p1j
p2j
pij
pkj
p0j
p1z
p2z
piz
pkz
p0z
p10
p20
pi0
100
pk0
Tab. 9 – Doppelte Verteilung der gesamten prozentuellen Häufigkeiten
In einer Kreuztabelle können drei verschiedene Arten von relativen (oder prozentuellen) Häufigkeiten berechnet werden:
1. Doppelte Verteilung von gesamten relativen Häufigkeiten. Diese erhält man, indem man jede absolute Häufigkeit durch die Gesamtanzahl n dividiert (multipliziert mit 100 ergibt das die gesamten prozentuellen Häufigkeiten).
wobei:
Konzeptualisierung doppelte Verteilung in der Sprache der Statistiker … (2/4)
2. Verteilung der relativen Häufigkeiten der Spalte.Diese erhält man, indem man jede absolute Häufigkeit durch die Summe der jeweiligen Spalte dividiert (multipliziert mit 100 ergeben sich die prozentuellen Häufigkeiten der Spalte).So kann, bei gleicher Anzahl der einzelnen Ausprägungen des Merkmals X, die unterschiedliche Zusammensetzung der Einheiten nach den Ausprägungen des Merkmals Y verglichen werden.
wobei:
Tab. 10 – Doppelte Verteilung der prozentuellen Häufigkeiten der Spalte
Modalità y1 Modalità y2 . Modalità yj . Modalità yz
Modalità x1 . .
Modalità x2 . .
. . . . . . . .
Modalità xi . .
. . . . . . . .
Modalità xk . .
Totale . .
Carattere XCarattere y
Totale
p11
p21
pi1
pk1
p01
p12
p22
pi2
pk2
p02
p1j
p2j
pij
pkj
p0j
p1z
p2z
piz
pkz
p0z 100
p11
p21
pi1
pk1
p01
p12
p22
pi2
pk2
p02
p1j
p2j
pij
pkj
p0j
p1z
p2z
piz
pkz
p0z 100
100
100
100
100
Konzeptualisierung doppelte Verteilung in der Sprache der Statistiker … (3/4)
3. Verteilung von relativen Häufigkeiten der Zeile. Diese erhält man, indem man jede absolute Häufigkeit durch die Summe der jeweiligen Zeile dividiert (multipliziert mit 100 ergeben sich die prozentuellen Häufigkeiten der Zeile). So kann, bei gleicher Anzahl der einzelnen Ausprägungen des Merkmals Y, die unterschiedliche Zusammensetzung der Einheiten nach den Ausprägungen des Merkmals X verglichen werden.
wobei:
Modalità y1 Modalità y2 . Modalità yj . Modalità yz
Modalità x1 . .
Modalità x2 . .
. . . . . . . .
Modalità xi . .
. . . . . . . .
Modalità xk . .
Totale . .
TotaleCarattere y
Carattere X
p11
p21
pi1
pk1
p12
p22
pi2
pk2
p1j
p2j
pij
pkj
p1z
p2z
piz
pkz
p10
p20
pi0
100
pk0
100 100 100 100
Tab. 11 – Doppelte Verteilung der prozentuellen Häufigkeiten der Zeile
Konzeptualisierung doppelte Verteilung in der Sprache der Statistiker … (4/4)
Einfache Tabelle: Erstellung mit Pivot-Tabelle
Um die absoluten Häufigkeiten der Tabelle 2 zu erstellen: ‘Internetnutzung’ in die Zeilenbeschriftungen und ‘Einheit’ in das Feld Werte ziehen (Einstellungen Feld Werte – Zusammenfassung Werte nach - Zählung)
Da wir jetzt das Instrument Pivot-Tabelle kennen, können wir es auch verwenden, um einfache Tabellen (mit nur einem Merkmal) zu erstellen.
Um die prozentuellen Häufigkeiten der Tabelle 2 zu erstellen: ‘Internetnutzung’ in die Zeilenbeschriftungen und ‘Einheit’ in das Feld Werte ziehen (Einstellungen Feld Werte – Zusammenfassung Werte nach - Zählung; zeige Werte als % der Spaltensumme)