This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
– Häufigkeiten– Maße der zentralen Tendenz– Maße der Dispersion
Deskriptive Statistik
02_grundbegriffe_kennwerte 2
• Definition:
„Unter deskriptiver Statistik versteht man ein Gruppe statistischer Methoden zur Beschreibung statistischer Daten anhand statistischer Kennwerte, Graphiken, Diagrammen oder Tabellen.“ (Leonhart, 2004)
• Deskriptive Statistik bezieht sich immer auf eine Stichprobe, d.h. auf die Personen, die tatsächlich untersucht bzw. beobachtet wurden.
• Die Inferenzstatistik zieht dagegen aus den in einer Stichprobe erhobenen Daten Schlüsse auf die zugrunde liegende Population.
Grundbegriffe der Datenerhebung
02_grundbegriffe_kennwerte 3
• Bei einer Datenerhebung geht es darum, bestimmte Merkmalsausprägungen der untersuchten Einheiten zu messen.
• Was sind Merkmale?
• Was sind Einheiten?
• Was ist eine Messung?
Deskriptive Statistik
02_grundbegriffe_kennwerte 4
Beispiel 1: Merkmale von Psychologiestudierenden:
• Geschlecht
• Alter
• Größe
• Wohnort
• Ängstlichkeit
• Extravertiertheit
• Statistikkenntnisse
Merkmale
02_grundbegriffe_kennwerte 5
Beispiel 2: Merkmale von Therapiemaßnahmen:
• Anzahl der therapeutischen Sitzungen (25 vs. 100)
• Therapeutisches „Setting“ (z.B. Einzel- vs. Gruppentherapie)
• Eingesetzte therapeutische Methoden (z.B. Gesprächsterapie vs. Verhaltenstherapie)
• Motivation des Klienten
• Motivation des Therapeuten
• …
Eine statistische Erhebung von Merkmalen muss nicht auf Basis von Personen erfolgen.
Merkmale
02_grundbegriffe_kennwerte 6
Qualitative vs. Quantitative Merkmale • Qualitative Merkmale beschreiben die Zugehörigkeit einer
Person oder eines Objektes zu einer Kategorie.• Quantitative Merkmale beschreiben die Ausprägung eines
• Um ein Merkmal exakt zu erfassen, muss eine präzise Operationalisierung (Messvorschrift) vorliegen.
• Die Operationalisierung definiert, wie unterschiedliche Ausprägungen eines Merkmals erfasst (kodiert) werden
• Die Kodierung der Merkmalsausprägungen erfolgt in der Regel in Zahlen.
• Man spricht nun von einer Variable, die die Information enthält.
• Ein Messung ist also eine Zuordnung von Zahlen zu Objekten gemäß den Regeln einer Operationalisierung.
Operationalisierung
02_grundbegriffe_kennwerte 10
Beispiele für Operationalisierungen
• Die Variable „sex“ soll das Geschlecht erfassen. Es wird für Frauen der Wert 1 und für Männer der Wert 2 verwendet.
• Die Variable „alter“ soll das Alter der untersuchten Personen in Jahren erfassen.
• Die Variable „alter“ soll das Alter von Säuglingen in Monaten erfassen.
• Die Variable „opt“ soll den selbst eingeschätzten Optimismus auf einer Skala von -2 (überhaupt nicht optimistisch) bis +2 (extrem optimistisch) erfassen.
• Die Variable „angst“ soll die Ängstlichkeit erfassen. Diese wird gemessen als die Zeitdauer in Sekunden, bis eine Spinne angefasst wird.
Variablen
02_grundbegriffe_kennwerte 11
Klassifikation von Variablen: Diskret vs. Kontinuierlich
• Diskrete Variablen: Die Anzahl der möglichen Werte ist abzählbar.
• Kontinuierliche Variablen: Die möglichen Werte liegen auf einem Kontinuum.
Die Ordinalskala• Bei der Ordinalskala (Rangskala) geben die Variablenwerte
Aufschluss über die Rangfolge der Merkmalsträger bezüglich des gemessenen Merkmals
• Beispiel: Schulabschluss„0“=kein SA, „1“=Haupts., „2“=Reals., „3“=Gymnasium)
• Zusätzliche Annahme für die Operationalisierung:3. Die zugeordneten Zahlen repräsentieren eine Rangreihe der
Merkmalsausprägung.
02_grundbegriffe_kennwerte 17
Skalenniveaus
Die Ordinalskala• Aussagekraft von Variablenwerten:
– Information über Gleichheit / Verschiedenheit der Merkmalsausprägung– Größer / Kleiner Relationen
• Mögliche Transformationen:– Erlaubt sind nur noch alle monotonen Transformationen.– Beispiele
• y = x + 3• y = 2x• y = log(x)
02_grundbegriffe_kennwerte 18
Skalenniveaus
Die Intervallskala• Bei der Intervallskala geben die Variablenwerte Aufschluss über
die Abstände zwischen Merkmalsausprägungen.• Beispiel: Ergebnisse eines Intelligenztests
(IQ (Peter) = 115; IQ(Anne) = 130 Differenz 15 Punkte )• Zusätzliche Annahme für die Operationalisierung:
4. Gleich große Intervalle zwischen Zahlenwerten der Variable repräsentieren gleich große Abstände in der Merkmalsausprägung.
02_grundbegriffe_kennwerte 19
Skalenniveaus
Die Intervallskala• Aussagekraft von Variablenwerten:
– Information über Gleichheit / Verschiedenheit der Merkmalsausprägung– Größer / Kleiner Relationen– Größe von Unterschieden
• Mögliche Transformationen:– Erlaubt sind nur noch alle linearen Transformationen (y = ax+b).– Beispiele
• y = x - 100• y = 0.1 x
02_grundbegriffe_kennwerte 20
Skalenniveaus
Die Verhältnisskala• Die Verhältnisskala kann vor allem bei der Messung
physikalischer Größen (Länge, Gewicht, Zeit) angenommen werden.
• Beispiel: Reaktionszeit (ms)• Zusätzliche Annahme für die Operationalisierung:
5. Die Skala hat einen definierten Null-Punkt.
02_grundbegriffe_kennwerte 21
Skalenniveaus
Die Verhältnisskala• Aussagekraft von Variablenwerten:
– Information über Gleichheit / Verschiedenheit der Merkmalsausprägung– Größer / Kleiner Relationen – Größe von Unterschieden– Verhältnis von Merkmalsausprägungen (z.B. doppelte Reaktionszeit)
• Mögliche Transformationen:– Erlaubt sind nur noch alle multiplikativen Transformationen (y = ax).– Beispiele
• y = 0.001 x (Umrechnung von Millisekunden in Sekunden)∙• y = 24 x (Umrechnung von Jahren in Monate)∙
02_grundbegriffe_kennwerte 22
Skalenniveaus
Skalenniveau Beispiele Mögliche Aussagen
Erlaubte Trans-formationen
Nominalskala Geschlecht,Diagnosen
Gleichheit / Verschiedenheit
Eineindeutige Transformationen
Ordinalskala Schulbildung,Ratings
Größer / Kleiner Relationen
Monotone Trans-formationen
Intervallskala IQ, Persönlichkeits-merkmale
Gleichheit von Differenzen
Lineare Trans-formationen
Verhältnisskala Alter,Reaktionszeit
Gleichheit von Verhältnissen
MultiplikativeTransformationen
02_grundbegriffe_kennwerte 23
Skalenniveaus
• Das Skalenniveau hängt ab:1. Von dem erhobenen Merkmal2. Von der Operationalisierung der Messung
• Beispiele: Geschlecht ist immer Nominalskaliert, da das Merkmal an sich keine
Rangreihe oder Intervalle definiert. Ängstlichkeit kann jedoch nominal-, ordinal-, oder intervallskaliert
erhoben werden (s.o.)
• Durch die Art der Messung kann das Skalenniveau sinken.
02_grundbegriffe_kennwerte 24
Skalenniveaus
Niveau eines Merkmals vs. Niveau der Variablen• Beispiel 1: Zeit bis zum Anfassen der Spinne
– Peter: 10 Sekunden; Martin: 20 Sekunden– Also: „Martin hat doppelt so lange gezögert wie Peter.“ (Zeit ist verhältnis-
skaliert)– Also: „Martin ist doppelt so ängstlich wie Peter“– Das ergibt keinen Sinn– Ängstlichkeit kann vermutlich nicht auf Verhältnisskalenniveau gemessen
werden.
• Für (latente) psychologische Konstrukte wird in aller Regel nur Intervallskalenniveau angenommen.
02_grundbegriffe_kennwerte 25
Skalenniveaus
Niveau eines Merkmals vs. Niveau der Variablen• Beispiel 2: Reaktionszeit
– Viele psychologische Studien beruhen auf Reaktionszeiten– Die Zeit ist verhältnisskaliert– Aber: Unterschiede zwischen 500 ms und 600 ms sind „psychologisch
bedeutsamer“ als Unterschiede zwischen 1500 ms und 1600 ms– Daher werden Reaktionszeiten vor der Auswertung manchmal
– Eine Logarithmierung ist eigentlich nur für ordinalskalierte Variablen zulässig.
– Dennoch wird angenommen, dass die logarithmierten Zeiten besser das intervallskalierte Konstrukt (z.B. Aufmerksamkeit) abbilden.
02_grundbegriffe_kennwerte 26
Skalenniveaus
Das Skalenniveau von Fragebogen• Oft ist das Skalenniveau umstritten:
– z.B. Schulnoten (ordinal oder intervall?)– z.B. „Ratings“ (ordinal oder intervall?)
• Für einzelne Fragebogenitems kann man nur von einem Ordinalskalennieveau ausgehen
• Bei einer Aggregation von vielen „Items“ (Summenbildung) wird meist von einem Intervallskalenniveau ausgegangen.
• Für psychologische Untersuchungen ist das Intervallskalenniveau von besonderer Bedeutung, da viele statistische Verfahren nur bei intervallskalierten Daten eingesetzt werden können.
02_grundbegriffe_kennwerte 27
Unterschiedliche Fragebogenformate
02_grundbegriffe_kennwerte 28
Trifft zu
Trifft nicht zu
Bei allem sehe ich stets die positive Seite. 1 0
Ich blicke immer mit Zuversicht in die Zukunft 1 0
Auch in unsicheren Zeiten rechne ich im allgemeinen damit, dass sich alles zum Besten wendet.
1 0
Alles in allem erwarte ich, dass mir mehr gute als schlechte Dinge widerfahren.
1 0
Zweistufige Antworten
Unterschiedliche Fragebogenformate
02_grundbegriffe_kennwerte 29
Trifft
gar
nicht zu
Trifft
eher
nicht zu
Unbestimmt
Trifft
eher zu
Trifft
voll und
ganz zu
Bei allem sehe ich stets die positive Seite. -2 -1 0 1 2
Ich blicke immer mit Zuversicht in die Zukunft -2 -1 0 1 2
Auch in unsicheren Zeiten rechne ich im allgemeinen damit, dass sich alles zum Besten wendet.
-2 -1 0 1 2
Alles in allem erwarte ich, dass mir mehr gute als schlechte Dinge widerfahren.
-2 -1 0 1 2
Mehrstufige Ratingskalen
Unterschiedliche Fragebogenformate
02_grundbegriffe_kennwerte 30
Zufrieden 2 1 0 1 2 Ärgerlich
Gut 2 1 0 1 2 Schlecht
Ausgeruht 2 1 0 1 2 Schlapp
Gelassen 2 1 0 1 2 Angespannt
Ruhig 2 1 0 1 2 Unruhig
Bipolare Ratingskalen
Zusammenfassung Grundbegriffe
02_grundbegriffe_kennwerte 31
• Die deskriptive Statistik dient der Beschreibung einer Stichprobe.• Grundlage jeder Statistik ist ein Datensatz. Dieser entsteht durch
die Messung von Merkmalen der Mitglieder dieser Stichprobe.• Dabei spielt die Operationalisierung der Merkmale eine
entscheidende Rolle.• Die Daten können auf unterschiedlichen Skalenniveaus vorliegen:
• Grundsätzlich sollte versucht werden, bei einer Messung ein möglichst hohes Skalenniveau zu erreichen.
• Bei der Erfassung vieler psychologischer Merkmale kann ein Intervallskalenniveau erreicht werden.
Datensätze in SPSS
02_grundbegriffe_kennwerte 32
Datensätze in SPSS
02_grundbegriffe_kennwerte 33
Datensätze in SPSS
Erstellen eines neuen Datensatzes• Definieren der Variablen (Variablenansicht)
– Name (kurzer Bezeichner)– Typ (meist: Numerisch = Zahl oder String = Text)– evtl.: Variablenlable und Wertelable– wichtig: Wert für missings (fehlende Werte) definieren!– Messniveau (Skalenniveau): Nominal, ordinal, oder Metrisch
• Eingabe der Daten (Datenansicht)– Jede Zeile ist ein Fall (eine Versuchsperson)– Bei fehlenden Angaben immer den Wert für missings eintragen!
02_grundbegriffe_kennwerte 34
Statistische Kennwerte
02_grundbegriffe_kennwerte 35
• Daten können auf viele unterschiedliche Arten dargestellt werden.
• Es gehört zu den Kompetenzen eines Statistikers zu entscheiden, welche Art der Darstellung geeignet ist.
• Sinnvoll ist immer eine Zusammenfassung des ursprünglichen Datensatzes.
• Gleichzeitig soll aber auch möglichst viel Information über das erhobene Merkmal erhalten bleiben.
• Dies erfolgt z.B. durch die Darstellung von– Häufigkeiten– Maßen der Zentrale Tendenz– Maßen der Dispersion
Häufigkeiten
• Eine Urliste enthält alle Werte einer Stichprobe• Beispiel Geschlecht: (w, w, w, m, m, w, w, w, w, m, w, m, …)• Zur Darstellung der Geschlechterverteilung fasst man diese
Urliste zusammen:
• Berechnung der Prozente:
02_grundbegriffe_kennwerte 36
Geschlecht Anzahl Prozent
w 7521.4%
m 21 76.5 %
gesamt 96100.0 %
100Prozent GesamtAnz
KategorieAnz
Häufigkeiten in SPSS
Befehle in SPSS• Grundsätzlich gibt es zwei Möglichkeiten, Befehle aufzurufen
(1) Das Menu• Vorteil: Einfache Bedienung, wenn man sich nicht gut auskennt• Nachteil: Wenn man das Ergebnis nochmal braucht, muss man alles von neuem
anklicken.(2) Das Syntaxfenster
• Öffnen mit Datei > Neu > Syntax• Dann können Befehle direkt eingetippt werden.• Vorteil: Man kann die Syntax speichern, und alle Berechnungen später erneut
ausführen• Nachteil: Man muss die Befehle kennen• Sie müssen den Syntax nicht für die Klausur lernen.• ABER: Ich empfehle jedem regelmäßigem SPSS Nutzer, sich mit der SPSS Syntax
vertraut zu machen.
02_grundbegriffe_kennwerte 37
Häufigkeiten in SPSS
Häufigkeiten über das Menu berechnen• Analysieren > Deskriptive Statistik > Häufigkeiten
02_grundbegriffe_kennwerte 38
Häufigkeiten in SPSS
Häufigkeiten über das Menu berechnen• Die interessierenden Variablen aus der Liste (links) in das
Auswahlfeld (rechts) schieben
• … und OK anklicken
02_grundbegriffe_kennwerte 39
Häufigkeiten in SPSS
Häufigkeiten über den Syntax berechnen• Ein Syntaxfester öffnen• Den Befehl eingeben:
– frequency sex.– fre sex.
• Den Befehl ausführen:– Strg. R („run“)– oder den blauen Pfeil
• Oft hat ein Merkmal zu viele Ausprägungen, um für jede einzelne die Häufigkeit anzugeben.
• In diesem Fall kann es sinnvoll sein, Kategorien zu bilden.• Regeln für die Bildung von Kategorien:
– Kategorien sind disjunkt (keine Überlappung)– Kategorien sind direkt benachbart (keine Lücken)– An den Rändern sind „offene“ Kategorien erlaubt– Alle geschlossenen Kategorien sind gleich breit– Je größer eine Stichprobe, desto mehr und desto schmalere Kategorien
werden gebildet, in der Regel nicht mehr als 20.– Faustregel für die Anzahl der Kategorien (Leonhard, 2004):
• Bei N Probanden: m = 1 + 3.32 · log (N)• Bei 20 Probanden: m = 1 + 3.32 · log (20) = 1 + 3.32 · 1.3 ≈ 4• Bei 100 Probanden: m = 1 + 3.32 · log (100) = 1 + 3.32 · 2.0 ≈ 8• Bei 1000 Probanden: m = 1 + 3.32 · log (100) = 1 + 3.32 · 3.0 ≈ 10
Selbsteinschätzung der Statistikkenntnisse (Kategorisiert)
Maße der Zentralen Tendenz
02_grundbegriffe_kennwerte 47
• Maße der zentralen Tendenz geben an, wie ein Merkmal bei den meisten Mitgliedern einer Stichprobe bzw. in dieser Stichprobe im Durchschnitt ausgeprägt ist.
• Es gibt dafür unterschiedliche Maße der zentralen Tendenz– Modalwert (für alle Skalentypen)– Median (für mindestens ordinalskalierte Daten)– Mittelwert (für mindestens intervallskalierte Daten).
Der Modalwert
02_grundbegriffe_kennwerte 48
• Der Modalwert (Modus, Mo) ist derjenige Wert aus einer Verteilung, welcher am häufigsten besetzt ist.
• Es kann auch mehrere Modalwerte geben.– SPSS gibt dann nur den kleinsten Wert aus.
• Bei kategorisierten Daten wird die Mitte der am häufigsten besetzten Kategorie angegeben.
• Die Angabe des Modalwertes ist besonders bei nominalskalierten Daten sinnvoll.
Der Modalwert
02_grundbegriffe_kennwerte 49
Kategorie Prozent
0 ≤ x < 10 18.40%10 ≤ x < 20 23.40%20 ≤ x < 30 15.30%30 ≤ x < 40 14.30%40 ≤ x < 50 10.20%50 ≤ x < 60 11.30%60 ≤ x 7.10%
Den Modalwert über das Menu berechnen• Analysieren > Deskriptive Statistiken > Häufigkeiten…• Auswahl „Statistiken …“• Auswahl „Modalwert“
Der Modalwert in SPSS
02_grundbegriffe_kennwerte 51
Den Modalwert über den Syntax berechnen
• Ergänzende Unterbefehle in der Syntax werden immer mit einem „/“ eingeleitet.
• Ganz am Ende des Kommandos steht ein Punkt.• „/format notable“ unterdrückt die normale Häufigkeitstabelle• „/statistics modus” gibt den Modalwert aus.
frequencies age /format notable /statistics modus.
Der Modalwert in SPSS
02_grundbegriffe_kennwerte 52
Modalwert – SPSS Ausgabe
Der Median
02_grundbegriffe_kennwerte 53
Der Median• Der Median (Md) ist derjenige Wert, der die geordnete Reihe der
Messwerte in die oberen und die unteren 50 Prozent aufteilt. Somit ist die Anzahl der Messwerte über und unter dem Median gleich.
• Man benötigt ordinalskalierte Daten, um eine „geordnete Reihe“ bilden zu können.
Der Median
02_grundbegriffe_kennwerte 54
Der Median – Berechnung• Für ungerade N nimmt man den Wert in der Mitte der
• Für gerade N nimmt man den Mittelwert der beiden in der Mitte stehenden Werte:– Liste: 20, 21, 23, 27, 35, 36– Md = (23+27) / 2 = 25
– Allgemein:
2
1 NxMd
2
122
NN xx
Md
Der Median
02_grundbegriffe_kennwerte 55
Beispiel:
Der Median in SPSS
02_grundbegriffe_kennwerte 56
Den Median über das Menu berechnen• Analysieren > Deskriptive Statistiken > Häufigkeiten• Auswahl „Statistiken …“• Auswahl „Median“
Der Median in SPSS
02_grundbegriffe_kennwerte 57
Den Median über den Syntax berechnen
• Ergänzende Unterbefehle in der Syntax werden immer mit einem „/“ eingeleitet.
• Ganz am Ende des Kommandos steht ein Punkt.• „/format notable“ unterdrückt die normale Häufigkeitstabelle• „/statistics median” gibt den Median aus.• Man kann auch Kennwerte kombinieren:
– “/statistics median, modus.”
frequencies age /format notable /statistics median.
Der Median in SPSS
02_grundbegriffe_kennwerte 58
Median – SPSS Ausgabe
Der Median
Der Median bei kategorisierten Daten• Bei kategorisierten Daten wird berücksichtigt, wie viel Prozent
der Stichprobe oberhalb und unterhalb der Kategorie mit dem Median liegen.
• Berechnung:
– uG: Untere Grenze der Kategorie, in der der Median liegt.– KB Breite der Kategorie– fk Häufigkeit in der Kategorie k, in der der Median liegt– cum fk-1: kumulierte Häufigkeit der Kategorie k-1, d.h. die Summe
derHäufigkeiten aller Kategorien unter dem Median.
02_grundbegriffe_kennwerte 59
KBf
fcumNuGMd
k
k
15.0
Der Median
Berechnung
02_grundbegriffe_kennwerte 60
KBf
fcumNuGMd
k
k
15.0
Kategorie f cumf
0 ≤ x < 10 18 18
10 ≤ x < 20 24 42
20 ≤ x < 30 15 57
30 ≤ x < 40 14 71
40 ≤ x < 50 11 82
50 ≤ x < 60 11 93
60 ≤ x 7 100
7.24
7.420
1047.020
1015
42985.020
Md
Das arithmetische Mittel
02_grundbegriffe_kennwerte 61
Das arithmetische Mittel• Der arithmetische Mittel (Mittelwert, „Durchschnitt“, ) ist das
häufigste Maß der zentralen Tendenz.• Das arithmetische Mittel darf nur für intervallskalierte Daten
berechnet werden.
x
Das arithmetische Mittel
02_grundbegriffe_kennwerte 62
Das arithmetische Mittel – Berechnung• Das arithmetische Mittel ist die Summe aller Messwerte geteilt
durch deren Anzahl N.
N
xx
N
i i 1 Zum Rechnen mit dem Summenzeichen siehe auch Leonhart (2004, S. 421f)
Das arithmetische Mittel
02_grundbegriffe_kennwerte 63
Beispiel:Vp lot
1 16
2 23
3 12
4 19
5 25
195
95x
Das arithmetische Mittel in SPSS
02_grundbegriffe_kennwerte 64
Das arithmetische Mittel über das Menu berechnen• Analysieren > Deskriptive Statistiken > Deskriptive Statistik… • Variable auswählen• OK
Das arithmetische Mittel in SPSS
02_grundbegriffe_kennwerte 65
Das arithmetische Mittel über den Syntax berechnen
oder
oder
oder
descriptives lot.
descriptives lot /statistic mean.
descriptives age, lot, stat_k /statistic mean.
frequency age, lot, stat_k /format notable /statistic mean.
Das arithmetische Mittel in SPSS
02_grundbegriffe_kennwerte 66
Das arithmetische Mittel– SPSS Ausgabe
descriptives age, stat_k, lot /statistic mean.
frequency age, stat_k, lot /format notable /statistic mean.
Vergleich der Maße der Zentralen Tendenz
02_grundbegriffe_kennwerte 67
frequencies age, freiburg /format notable /statistics modus median mean.
• Alter: Mittelwert > Median > Modus• Einstellung zu Freiburg: Modus > Median > Mittelwert• Warum?
Vergleich der Maße der Zentralen Tendenz
02_grundbegriffe_kennwerte 68
Vergleich der Maße der Zentralen Tendenz
02_grundbegriffe_kennwerte 69
Symmetrische Verteilung
Modus Median AM
Modus Median AM
Rechtssteile Verteilung Linkssteile Verteilung
Modus Median AM
Das gewichtete arithmetische Mittel (GAM)
02_grundbegriffe_kennwerte 70
Das gewichtete arithmetische Mittel (GAM)• Problem: Wie berechnet man das arithmetische Mittel, wenn
man nur Mittelwerte aus verschiedenen Gruppen kennt?• Beispiel: Die Studienmotivation von Psychologiestudierenden des
1.Semesters soll bestimmt werden. Ein Fragebogen wird in den drei Tutorien vorgegeben. Die Tutorinnen melden folgende Ergebnisse zurück:– Gruppe 1: M = 12– Gruppe 2: M = 10– Gruppe 3: M = 8
• Wichtig: Die Gruppengrößen müssen beachtet werden!
Das gewichtete arithmetische Mittel (GAM)
02_grundbegriffe_kennwerte 71
Berechnung:
Gruppe 1: M=12; N=50Gruppe 2: M=10; N=20;Gruppe 3: M=8; N=10;
k
i i
k
i ii
n
xnGAM
1
1
1180
88080
80200600102050
81010201250321
332211
nnn
xnxnxnGAM
Zusammenfassung: Maße der zentralen Tendenz
02_grundbegriffe_kennwerte 72
• Eine einfache Form der Zusammenfassung ist die Darstellung der Häufigkeiten oder Prozente.
• Der Modalwert ist der Wert einer Verteilung, der am häufigsten vorkommt.
• Der Median ist der Wert, der eine Stichprobe in die oberen 50% und unteren 50% aufteilt.
• Der Mittelwert ist die Summe aller Werte geteilt durch die Anzahl der Werte.
• Die Maße der zentralen Tendenz lassen auch Rückschlüsse auf die Verteilungsform zu.
• Sollen Mittelwerte aus Mittelwerten berechnet werden, müssen die Gruppengrößen berücksichtigt werden (GAM).
Maße der Dispersion
• Die Maße der zentralen Tendenz geben Auskunft über die „Mitte“ einer Verteilung.
• Maße der Dispersion beziehen sie dagegen auf die „Variabilität“ einer Verteilung, d.h. darauf, wie sehr sich die Werte unterscheiden.
• Beispiel: Schulnoten in zwei Klassen– Gruppe 1: 3, 3, 3, 3, 3, 3, 3– Gruppe 2: 1, 2, 3, 3, 3, 4, 5– Modalwert (=3), Median (=3) und Mittelwert (=3) unterscheiden nicht
zwischen beiden Gruppen!– Dennoch gibt es natürlich Unterschiede zwischen den Verteilungen.
02_grundbegriffe_kennwerte 73
Maße der Dispersion
Maße der Dispersion:• Spannweite• Interquartilabstand• Varianz• Standardabweichung• Schiefe, Exzess
02_grundbegriffe_kennwerte 74
Spannweite (Range)
• Die Spannweite wird auch als Variationsbreite oder Range bezeichnet.
• Unterschiedliche Definitionen für kontinuierliche und diskrete Variablen:– Für kontinuierliche Variablen:
Range = maximaler Wert – minimaler Wert.– Für diskrete Variablen:
Range = maximaler Wert – minimaler Wert +1(bzw.: Range = Anzahl der Kategorien)
• Bewertung– Eher geringe Aussagekraft über die Verteilung, da nur 2 Werte
berücksichtigt werden (der Kleinste und der Größte)– Hohe Empfindlichkeit gegenüber Ausreißerwerten.
02_grundbegriffe_kennwerte 75
Spannweite (Range)
Beispiel: Wie groß ist der „Range“?
02_grundbegriffe_kennwerte 76
Minimum Maximum Range
Geschlecht 1 2 2
Alter 18 49 31
Bundesland 1 11 11
Kenntnisse „Freiburg“ 5 90 85
Spannweite (Range)
• In SPSS kann der Range über den Befehl „Häufigkeiten“ ausgegeben werden.– Anwählen: Statistiken > Spannweite
• Syntax:
• Achtung: SPSS verwendet immer die Formel für kontinuierliche Variablen!
02_grundbegriffe_kennwerte 77
frequency age, stat_k, lot /format notable /statistic range.
Interquartilabstand
• Als Quartilgrenzen werden die drei Punkte einer Verteilung bezeichnet, welche die geordnete Liste von Werten in vier Bereiche mit jeweils 25% der Stichprobe einteilen.– 25% (1. QG) 25% (2. QG) 25% (3. QG) 25%
• Die 2. Quartilgrenze entspricht damit dem Median• Beispiel: In einem Assessment-Center erhalten die 12 Teilnehmer