28.01.14 1 VL Methodenlehre I WS13/14 Schäfer METHODENLEHRE I WS 2013/14 THOMAS SCHÄFER VL Methodenlehre I WS13/14 Schäfer DAS THEMA: INFERENZSTATISTIK IV – INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE • Inferenzstatistik für Zusammenhänge • Inferenzstatistik für Unterschiede
23
Embed
METHODENLEHRE I - tu-chemnitz.de · 28.01.14 2 VL Methodenlehre I WS13/14 Schäfer Inferenzstatistik für Zusammenhänge • Standardfehler • Konfidenzintervalle • Signifikanztest
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
28.01.14
1
VL Methodenlehre I WS13/14 Schäfer
METHODENLEHRE I WS 2013/14
THOMAS SCHÄFER
VL Methodenlehre I WS13/14 Schäfer
DAS THEMA: INFERENZSTATISTIK IV – INFERENZSTATISTISCHE AUSSAGEN FÜR ZUSAMMENHÄNGE UND UNTERSCHIEDE • Inferenzstatistik für Zusammenhänge • Inferenzstatistik für Unterschiede
28.01.14
2
VL Methodenlehre I WS13/14 Schäfer
Inferenzstatistik für Zusammenhänge • Standardfehler • Konfidenzintervalle • Signifikanztest
• Zusammenhänge werden in der Regel durch Korrelationskoeffizienten
ausgedrückt, am häufigsten durch die Pearson-Korrelation r
• ein in einer Stichprobe gefundener Zusammenhang r kann wieder auf die
Population verallgemeinert werden – der Schätzwert heißt ρ (Rho)
• auch für diese Schätzung fragen wir wieder nach der Güte und wollen
daher inferenzstatistische Aussagen machen
Beispiel: Wie groß ist der Zusammenhang zwischen der Anzahl von Störchen
und der Anzahl Neugeborener? à Wir untersuchen als Stichprobe den Raum
• der Standardfehler für ρ berechnet sich wie folgt:
• für unser Beispiel:
à bezogen auf die Skala von r ist das ein recht großer Standardfehler
à anders als bei Mittelwerten wird der Standardfehler für Korrelationen
normalerweise nicht in Abbildungen irgendeiner Art verwendet
STANDARDFEHLER FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
ρ
ρ
• auch bei Korrelationen gilt: eigentlich müssten wir für jeden
Koeffizienten eine Stichprobenverteilung erstellen, um die Grenzen des
KI zu bestimmen
• auch hier könnte aber stattdessen die t-Verteilung verwendet werden
• ABER: die t-Verteilung ist nur gültig, wenn r = 0, ansonsten sind rs nicht
symmetrisch verteilt und können nicht durch t repräsentiert werden
• da wir aber in der Regel Effekte ungleich 0 haben, kann die t-Verteilung
nicht verwendet werden à stattdessen ist ein anderer „Umweg“ nötig,
der die Fisher-z-Transformation benutzt:
1. das gefundene r wird in einen z-Wert umgerechnet
2. die Grenzen des KI werden für diesen z-Wert bestimmt
3. die Grenzen in z-Werten werden wieder in rs zurückgerechnet
KI FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
28.01.14
4
à da Korrelationskoeffizienten von -1 bis 1 begrenzt sind, ist ihre
Stichprobenverteilung nur bei 0 symmetrisch; sie wird schiefer, je
stärker die Korrelation von 0 abweicht
à KI sind dann nicht mehr symmetrisch und können nicht mit Hilfe der t-
Verteilung bestimmt werden
KI FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
Fisher‘s-r-to-z-Tabelle
KI FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
r = .38 in der Tabelle suchen à der entsprechende zr-‐Wert ist 0,40
SchriE 1
28.01.14
5
z-Tabelle
Was sind die Grenzen des 95%-KI?
KI FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
à wieder bei 97,5% nachsehen à z = 1,96
SchriE 2
Bestimmung der Grenzen des KI ausgedrückt in z-Werten:
für das Beispiel:
à diese beiden Grenzen müssen nun wieder in rs umgerechnet werden
KI FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
SchriE 2
28.01.14
6
Fisher‘s-r-to-z-Tabelle
KI FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
für z = -‐0,34: à r = -‐0,327 à untere Grenze für z = 1,14: à r = 0,814 à obere Grenze
Hinweis: negaOve z-‐Werte führen auch zu negaOven rs!
SchriE 3
als Abbildung:
à wir finden ein asymmetrisches KI
KI FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
28.01.14
7
• wieder die Logik des Signifikanztests: unterstellt wird die H0, dass der
wahre Zusammenhang in der Population ρ = 0 ist • die H0-Verteilung zeigt also mögliche Korrelationen ungleich 0, die man
zufällig finden kann, auch wenn die H0 gilt • da die H0 von ρ = 0 ausgeht (und Korrelationen unter dieser
Voraussetzung normalverteilt sind), kann jetzt die t-Verteilung verwendet werden
SIGNIFIKANZTESTS FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
ρ
0
t
0
die Verteilung von KorrelaOonskoeffizienten kann durch die t-‐Verteilung
repräsenOert werden
• für den Test muss also die Korrelation in einen t-Wert umgerechnet
werden:
• dieser t-Wert wird dann auf Signifikanz geprüft mit
für das Beispiel:
à kritischer t-Wert für Alpha = 5%, df = 8, zweiseitig: 2,31
à tempirisch < tkritisch à Korrelationskoeffizient nicht signifikant
SIGNIFIKANZTESTS FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
(n ist die Anzahl der Wertepaare)
Formel t-Test für Korrelationskoeffizienten
df t-Test für Korrelationskoeffizienten
28.01.14
8
SIGNIFIKANZTESTS FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
t-Verteilung
df = n – 2 Beispiel: 10 – 2 = 8 à tkri)sch = 2,31
Alpha-‐Niveau
SIGNIFIKANZTESTS FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
das Beispiel in SPSS:
hier gibt es wieder den exakten p-‐Wert: 0,28
28.01.14
9
INFERENZSTATISTIK FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
Verwendung der drei Aussagen für Korrelationskoeffizienten:
Standardfehler
im Fließtext: so gut wie nie
in Abbildungen: so gut wie nie
Konfidenzintervalle
im Fließtext: zunehmend beliebt
in Abbildungen: zunehmend beliebt
Signifikanztests
im Fließtext: nahezu immer
in Abbildungen: sehr selten
INFERENZSTATISTIK FÜR ZUSAMMENHÄNGE
VL Methodenlehre I WS13/14 Schäfer
noch ein Hinweis
• auch Regressionskoeffizienten sind Zusammenhangsmaße
• für Regressionskoeffizienten können alle drei inferenzstatischen Maße
bestimmt werden
• auch hier sind die Konfidenzintervalle asymmetrisch, wenn β ≠ 0
• der Signifikanztest, der prüft, ob ein Regressionskoeffizient in der
Population von 0 verschieden ist, ist auch ein t-Test:
mit
Formel t-Test für Regressionskoeffizienten
df t-Test für Regressionskoeffizienten
Regressionskoeffizient Standardfehler des Koeffizienten
(n – SOchprobengröße; k – Anzahl von Prädiktoren)
28.01.14
10
• für Zusammenhänge werden inferenzstatische Aussagen recht häufig gemacht
• der Standardfehler wird aus der gefundenen Korrelation und der
Stichprobengröße berechnet
• Konfidenzintervalle sind für ρ ungleich 0 nicht symmetrisch, daher wird die
Fisher-r-in-z-Transformation genutzt, um die Grenzen des Intervalls zunächst in z-
Werten zu bestimmen und dann in Korrelationen zurück zu rechnen
• Konfidenzintervalle für Korrelationen sind zunehmend beliebt und sind sehr
empfehlenswert
• der Signifikanztest, der prüft, ob ein Korrelationskoeffizient in der Population
größer ist als 0, ist wieder ein t-Test
• auch für Regressionskoeffizienten können die drei inferenzstatistischen Maße
bestimmt werden
IS FÜR ZUSAMMENHÄNGE STECKBRIEF
VL Methodenlehre I WS13/14 Schäfer
VL Methodenlehre I WS13/14 Schäfer
Inferenzstatistik für Unterschiede • Standardfehler • Konfidenzintervalle • Signifikanztest
28.01.14
11
• wir beschränken uns auf Unterschiede von Mittelwerten
• wie jeder andere Parameter auch folgen die Differenzen von Mittelwerten
einer Normalverteilung
• es lässt sich also wieder eine Stichprobenverteilung von
Mittelwertsunterschieden ΔM erstellen, die die Grundlage für die
Bestimmung von Standardfehler und KI bildet:
STANDARDFEHLER FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
ΔM
gefundene Differenz
die Logik: diese Verteilung entsteht, wann man immer wieder Studien machen und die Differenz von zwei MiEelwerten besOmmen würde à diese verteilen sich um den wahren MiEelwertsunterschied in der PopulaOon
prinzipiell müssen zwei Fälle unterschieden werden
1. die Differenzen stammen von Messwerten von verschiedenen Personen
à Mittelwertsunterschiede von unabhängigen Stichproben
2. die Differenzen stammen von Messwiederholungen an denselben
Personen à Mittelwertsunterschiede von abhängigen Stichproben
STANDARDFEHLER FÜR UNTERSCHIEDE
VL Methodenlehre I WS13/14 Schäfer
Häufigkeitsverteilungen der Messwerte
SOchprobenverteilung der Differenzwerte
ΔM
xA xB
A und B können verschiedene Personen sein à unabhängige SP ODER A und B können Mess-‐wiederholungen an denselben Personen (oder sonsOge abhängige Messungen) sein à abhängige SP
28.01.14
12
Beispiel
Unterschied im Gewichtsverlust bei mehr oder weniger Schlaf
Fall 1: verschiedene Personen in den beiden Bedingungen à unabhängige SP
Fall 2: dieselben Personen in beiden Bedingungen à abhängige SP