Top Banner
Wahrscheinlichkeitsrechnung und Statistik f ¨ ur Biologen 5. Der zwei-Stichproben-t-Test (t-Test f ¨ ur ungepaarte Stichproben) und der Wilcoxon-Test Martin Hutzenthaler & Dirk Metzler http://evol.bio.lmu.de/_statgen
142

Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Mar 15, 2018

Download

Documents

ngokien
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wahrscheinlichkeitsrechnung undStatistik fur Biologen

5. Der zwei-Stichproben-t-Test(t-Test fur ungepaarte Stichproben)

und der Wilcoxon-Test

Martin Hutzenthaler & Dirk Metzler

http://evol.bio.lmu.de/_statgen

Page 2: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

1 Wiederholung: t-Test fur gepaarte Stichproben

2 t-Test fur ungepaarte StichprobenAngenommen, die Varianzen sind gleichWenn die Varianzen ungleich sein k’onntenPower eines TestsVergleich: gepaarter t-Test und ungepaarter t-Test

3 Wilcoxons RangsummentestMotivationWilcoxon-Test fur unabhangige Stichproben

4 Zusammenfassung

Page 3: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wiederholung: t-Test fur gepaarte Stichproben

Inhalt

1 Wiederholung: t-Test fur gepaarte Stichproben

2 t-Test fur ungepaarte StichprobenAngenommen, die Varianzen sind gleichWenn die Varianzen ungleich sein k’onntenPower eines TestsVergleich: gepaarter t-Test und ungepaarter t-Test

3 Wilcoxons RangsummentestMotivationWilcoxon-Test fur unabhangige Stichproben

4 Zusammenfassung

Page 4: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wiederholung: t-Test fur gepaarte Stichproben

”Student“ und seine Verteilung(en)

−4 −2 0 2 4

0.0

0.1

0.2

0.3

0.4

x

Dic

hte

4 Freiheitsgrade8 Freiheitsgrade20 FreiheitsgradeStandardnormalverteilung

William S. Gosset,1876–1937(c): public domain

Page 5: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wiederholung: t-Test fur gepaarte Stichproben

Zusammenfassung gepaarter t-Test

Gegeben: gepaarte Beobachtungen

(Y1, Z1), (Y2, Z2), . . . , (Yn, Zn)

Nullhypothese H0: µY = µZ

Signifikanzniveau: α (meist α = 5%)Test: gepaarter t-Test (genauer: zweiseitiger gepaarter t-Test)

Berechne Differenz X := Y − ZBerechne Teststatistik

t :=X

s(X )/√

n

p-Wert = Pr(|Tn−1| ≥ |t |) (n − 1 Freiheitsgrade)Verwirf Nullhypothese, falls p-Wert ≤ α

Page 6: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wiederholung: t-Test fur gepaarte Stichproben

Zusammenfassung gepaarter t-Test

Gegeben: gepaarte Beobachtungen

(Y1, Z1), (Y2, Z2), . . . , (Yn, Zn)

Nullhypothese H0: µY = µZ

Signifikanzniveau: α (meist α = 5%)

Test: gepaarter t-Test (genauer: zweiseitiger gepaarter t-Test)Berechne Differenz X := Y − ZBerechne Teststatistik

t :=X

s(X )/√

n

p-Wert = Pr(|Tn−1| ≥ |t |) (n − 1 Freiheitsgrade)Verwirf Nullhypothese, falls p-Wert ≤ α

Page 7: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wiederholung: t-Test fur gepaarte Stichproben

Zusammenfassung gepaarter t-Test

Gegeben: gepaarte Beobachtungen

(Y1, Z1), (Y2, Z2), . . . , (Yn, Zn)

Nullhypothese H0: µY = µZ

Signifikanzniveau: α (meist α = 5%)Test: gepaarter t-Test (genauer: zweiseitiger gepaarter t-Test)

Berechne Differenz X := Y − ZBerechne Teststatistik

t :=X

s(X )/√

n

p-Wert = Pr(|Tn−1| ≥ |t |) (n − 1 Freiheitsgrade)Verwirf Nullhypothese, falls p-Wert ≤ α

Page 8: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wiederholung: t-Test fur gepaarte Stichproben

Zusammenfassung gepaarter t-Test

Gegeben: gepaarte Beobachtungen

(Y1, Z1), (Y2, Z2), . . . , (Yn, Zn)

Nullhypothese H0: µY = µZ

Signifikanzniveau: α (meist α = 5%)Test: gepaarter t-Test (genauer: zweiseitiger gepaarter t-Test)

Berechne Differenz X := Y − ZBerechne Teststatistik

t :=X

s(X )/√

n

p-Wert = Pr(|Tn−1| ≥ |t |) (n − 1 Freiheitsgrade)Verwirf Nullhypothese, falls p-Wert ≤ α

Page 9: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wiederholung: t-Test fur gepaarte Stichproben

Zusammenfassung Ein-Stichproben t-Test

Gegeben: Beobachtungen

X1, X2, . . . , Xn

Nullhypothese H0: µX = c (Den Wert c testet man, oft c = 0)Signifikanzniveau: α (meist α = 5%)Test: t-Test

Berechne Teststatistik

t :=X − c

s(X )/√

n

p-Wert = Pr(|Tn−1| ≥ |t |) (n − 1 Freiheitsgrade)Verwirf Nullhypothese, falls p-Wert ≤ α

Page 10: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wiederholung: t-Test fur gepaarte Stichproben

Zusammenfassung Ein-Stichproben t-Test

Gegeben: Beobachtungen

X1, X2, . . . , Xn

Nullhypothese H0: µX = c (Den Wert c testet man, oft c = 0)Signifikanzniveau: α (meist α = 5%)

Test: t-TestBerechne Teststatistik

t :=X − c

s(X )/√

n

p-Wert = Pr(|Tn−1| ≥ |t |) (n − 1 Freiheitsgrade)Verwirf Nullhypothese, falls p-Wert ≤ α

Page 11: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wiederholung: t-Test fur gepaarte Stichproben

Zusammenfassung Ein-Stichproben t-Test

Gegeben: Beobachtungen

X1, X2, . . . , Xn

Nullhypothese H0: µX = c (Den Wert c testet man, oft c = 0)Signifikanzniveau: α (meist α = 5%)Test: t-Test

Berechne Teststatistik

t :=X − c

s(X )/√

n

p-Wert = Pr(|Tn−1| ≥ |t |) (n − 1 Freiheitsgrade)Verwirf Nullhypothese, falls p-Wert ≤ α

Page 12: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wiederholung: t-Test fur gepaarte Stichproben

Zusammenfassung Ein-Stichproben t-Test

Gegeben: Beobachtungen

X1, X2, . . . , Xn

Nullhypothese H0: µX = c (Den Wert c testet man, oft c = 0)Signifikanzniveau: α (meist α = 5%)Test: t-Test

Berechne Teststatistik

t :=X − c

s(X )/√

n

p-Wert = Pr(|Tn−1| ≥ |t |) (n − 1 Freiheitsgrade)Verwirf Nullhypothese, falls p-Wert ≤ α

Page 13: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben

Inhalt

1 Wiederholung: t-Test fur gepaarte Stichproben

2 t-Test fur ungepaarte StichprobenAngenommen, die Varianzen sind gleichWenn die Varianzen ungleich sein k’onntenPower eines TestsVergleich: gepaarter t-Test und ungepaarter t-Test

3 Wilcoxons RangsummentestMotivationWilcoxon-Test fur unabhangige Stichproben

4 Zusammenfassung

Page 14: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Angenommen, die Varianzen sind gleich

Inhalt

1 Wiederholung: t-Test fur gepaarte Stichproben

2 t-Test fur ungepaarte StichprobenAngenommen, die Varianzen sind gleichWenn die Varianzen ungleich sein k’onntenPower eines TestsVergleich: gepaarter t-Test und ungepaarter t-Test

3 Wilcoxons RangsummentestMotivationWilcoxon-Test fur unabhangige Stichproben

4 Zusammenfassung

Page 15: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Angenommen, die Varianzen sind gleich

photo (c) by J. Holopainen

Page 16: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Angenommen, die Varianzen sind gleich

Beispiel: Bevorzugen Spinnmilben Pflanzen, die bisher nicht vonSpinnmilben befallen waren?

Infiziere Baumwollstraucher mit Milben (Tetranychus urticae)und zahle die Milben auf Pflanzen, die schon mal befallenwaren, und auf solchen, die zum ersten Mal befallen sind.

Die hier gezeigten Daten sind per Computersimulation erzeugt,aber echten Daten nachempfunden, siehe z.B.

S. Harrison, R. Karban: Behavioral response of spider mites(Tetranychus urticae) to induced resistance of cotton plantsEcological Entomology 11:181-188, 1986.

Page 17: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Angenommen, die Varianzen sind gleich

50 100 150 200 250 300

y fi

rst t

ime

mite

sx

had

mite

s be

fore

● ● ● ●●● ●●● ●● ●

●● ●● ●●

● ●

●● ●● ● ●● ●

● ●●●

●● ● ●●

●●

µ(y) = 168.4

sd(y) = 91.09763

sd(y)/√

20 = 20.37005

µ(x) = 121.65

sd(x) = 47.24547

sd(x)/√

20 = 10.56441

Page 18: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Angenommen, die Varianzen sind gleich

50 100 150 200 250 300

y fi

rst t

ime

mite

sx

had

mite

s be

fore

● ● ● ●●● ●●● ●● ●

●● ●● ●●

● ●

●● ●● ● ●● ●

● ●●●

●● ● ●●

●●

µ(y) = 168.4

sd(y) = 91.09763

sd(y)/√

20 = 20.37005

µ(x) = 121.65

sd(x) = 47.24547

sd(x)/√

20 = 10.56441

Page 19: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Angenommen, die Varianzen sind gleich

50 100 150 200 250 300

y fi

rst t

ime

mite

sx

had

mite

s be

fore

● ● ● ●●● ●●● ●● ●

●● ●● ●●

● ●

●● ●● ● ●● ●

● ●●●

●● ● ●●

●●

µ(y) = 168.4

sd(y) = 91.09763

sd(y)/√

20 = 20.37005

µ(x) = 121.65

sd(x) = 47.24547

sd(x)/√

20 = 10.56441

Page 20: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Angenommen, die Varianzen sind gleich

Unsere Nullhypothese H0: Alle Werte sind unabhangig aus der

selben Normalverteilung gezogen.

(Passt streng genommennicht, da es hier um Anzahlen geht. Da es aber nicht sehr kleineZahlen sind, approximativ okay.)

Diese Nullhypothese H0 beinhaltet, dass die beiden Stichproben(“schon vorher infiziert” und “zum erste mal infiziert”) ausVerteilungen stammen, die nicht nur den selben Mittelwerthaben (was wir eigentlich testen wollen) sondern auch die selbeVarianz. Letzteres verwenden wir, wenn wir fur die Berechnungder t-Statistik die Standardabweichung der Differenz derStichprobenmittelwerte schatzen.

Page 21: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Angenommen, die Varianzen sind gleich

Unsere Nullhypothese H0: Alle Werte sind unabhangig aus der

selben Normalverteilung gezogen.(Passt streng genommennicht, da es hier um Anzahlen geht. Da es aber nicht sehr kleineZahlen sind, approximativ okay.)

Diese Nullhypothese H0 beinhaltet, dass die beiden Stichproben(“schon vorher infiziert” und “zum erste mal infiziert”) ausVerteilungen stammen, die nicht nur den selben Mittelwerthaben (was wir eigentlich testen wollen) sondern auch die selbeVarianz. Letzteres verwenden wir, wenn wir fur die Berechnungder t-Statistik die Standardabweichung der Differenz derStichprobenmittelwerte schatzen.

Page 22: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Angenommen, die Varianzen sind gleich

Unsere Nullhypothese H0: Alle Werte sind unabhangig aus der

selben Normalverteilung gezogen.(Passt streng genommennicht, da es hier um Anzahlen geht. Da es aber nicht sehr kleineZahlen sind, approximativ okay.)

Diese Nullhypothese H0 beinhaltet, dass die beiden Stichproben(“schon vorher infiziert” und “zum erste mal infiziert”) ausVerteilungen stammen, die nicht nur den selben Mittelwerthaben (was wir eigentlich testen wollen) sondern auch die selbeVarianz. Letzteres verwenden wir, wenn wir fur die Berechnungder t-Statistik die Standardabweichung der Differenz derStichprobenmittelwerte schatzen.

Page 23: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Angenommen, die Varianzen sind gleich

> t.test(y,x,var.equal=TRUE)

Two Sample t-test

data: y and x

t = 2.0373, df = 38, p-value = 0.04862

alternative hypothesis: true difference in

means is not equal to 0

95 percent confidence interval:

0.2970719 93.2029281

sample estimates:

mean of x mean of y

168.40 121.65

Page 24: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Angenommen, die Varianzen sind gleich

Theorem (zwei-Stichproben t-Test, ungepaart mit gleichenVarianzen)Seien X1, . . . , Xn und Y1, . . . , Ym unabhangige normalverteilteZufallsvariablen mit der selben Varianz σ2. Als gepoolteStichprobenvarianz definieren wir

s2p =

(n − 1) · s2X + (m − 1) · s2

Y

m + n − 2.

Unter der Nullhypothese gleicher Erwartungswerte µX = µy folgtdie Statistik

t =X − Y

sp ·√

1n + 1

m

einer t-Verteilung mit n + m − 2 mit Freiheitsgraden.

Page 25: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

Inhalt

1 Wiederholung: t-Test fur gepaarte Stichproben

2 t-Test fur ungepaarte StichprobenAngenommen, die Varianzen sind gleichWenn die Varianzen ungleich sein k’onntenPower eines TestsVergleich: gepaarter t-Test und ungepaarter t-Test

3 Wilcoxons RangsummentestMotivationWilcoxon-Test fur unabhangige Stichproben

4 Zusammenfassung

Page 26: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

Beispiel: Backenzahne von Hipparions

(c): public domain

Page 27: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

Die Daten

77 Backenzahne

gefunden in den Chiwondo Beds, Malawi,

jetzt in den Sammlungen desHessischen Landesmuseums, Darmstadt

Page 28: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

Die Daten

77 Backenzahne

gefunden in den Chiwondo Beds, Malawi,

jetzt in den Sammlungen desHessischen Landesmuseums, Darmstadt

Page 29: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

Die Daten

77 Backenzahne

gefunden in den Chiwondo Beds, Malawi,

jetzt in den Sammlungen desHessischen Landesmuseums, Darmstadt

Page 30: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

(c): Rei-artur

Page 31: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

Zuordnung

Die Zahne wurden zwei Arten zugeordnet:

Hipparion africanum≈ 4 Mio. Jahre

Hipparion libycum≈ 2,5 Mio. Jahre

Page 32: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

(c): public domain

Page 33: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

Geologischer Hintergrund

Vor 2,8 Mio. Jahren kuhlte sich das Klima weltweit ab.

Das Klima in Ostafrika:warm-feucht −→ kuhl-trocken

Hipparion:Laubfresser −→ Grasfresser

Page 34: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

Geologischer Hintergrund

Vor 2,8 Mio. Jahren kuhlte sich das Klima weltweit ab.

Das Klima in Ostafrika:warm-feucht −→ kuhl-trocken

Hipparion:Laubfresser −→ Grasfresser

Page 35: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

Geologischer Hintergrund

Vor 2,8 Mio. Jahren kuhlte sich das Klima weltweit ab.

Das Klima in Ostafrika:warm-feucht −→ kuhl-trocken

Hipparion:Laubfresser −→ Grasfresser

Page 36: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

Frage

Hipparion:Laubfresser −→ Grasfresser

andere Nahrung −→ andere Zahne?

Messungen: mesiodistale Langedistal = von der Mittellinie weg

Page 37: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

Frage

Hipparion:Laubfresser −→ Grasfresser

andere Nahrung −→ andere Zahne?

Messungen: mesiodistale Langedistal = von der Mittellinie weg

Page 38: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

Frage

Hipparion:Laubfresser −→ Grasfresser

andere Nahrung −→ andere Zahne?

Messungen: mesiodistale Langedistal = von der Mittellinie weg

Page 39: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

25 30 35 40

H. l

ibyc

umH

. afr

ican

um

mesiodistale Länge [mm]

Page 40: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

25 30 35 40

H. l

ibyc

umH

. afr

ican

um

mesiodistale Länge [mm]

xA == 25.9

xL == 28.4

Page 41: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

25 30 35 40

H. l

ibyc

umH

. afr

ican

um

mesiodistale Länge [mm]

xA == 25.9, sA == 2.2

xL == 28.4, sL == 4.3

xA ++ sAxA −− sA

xL ++ sLxL −− sL

Page 42: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

25 30 35 40

H. l

ibyc

umH

. afr

ican

um

mesiodistale Länge [mm]

xA ++ Standardfehler

xL ++ Standardfehler

Page 43: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

Wir beobachten (nA = 39, nL = 38):

xA = 25,9, sA = 2,2,

unser Schatzwert fur die Streung von xA istalso fA = sA = 2,2/

√nA = 0,36 (Standardfehler),

xL = 28,4, sL = 4,3, unser Schatzwert fur die Streung von xL istalso fL = sL = 4,3/

√nL = 0,70.

Ist die beobachtete Abweichung xL − xA = 2,5 mit derNullhypothese vertraglich, dass µL = µA?

Da die Stichproben von zwei verschiedenen Arten kommen,beinhaltet unsere Nullhypothese diesmal nicht, dass beide aus

der selben Verteilung kommen. Wir wollten also hier nichtvoraussetzen, dass beide Arten die selbe Varianzen bei den

Zahngroßen haben.

Page 44: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

Wir beobachten (nA = 39, nL = 38):

xA = 25,9, sA = 2,2, unser Schatzwert fur die Streung von xA istalso fA = sA = 2,2/

√nA = 0,36 (Standardfehler)

,

xL = 28,4, sL = 4,3, unser Schatzwert fur die Streung von xL istalso fL = sL = 4,3/

√nL = 0,70.

Ist die beobachtete Abweichung xL − xA = 2,5 mit derNullhypothese vertraglich, dass µL = µA?

Da die Stichproben von zwei verschiedenen Arten kommen,beinhaltet unsere Nullhypothese diesmal nicht, dass beide aus

der selben Verteilung kommen. Wir wollten also hier nichtvoraussetzen, dass beide Arten die selbe Varianzen bei den

Zahngroßen haben.

Page 45: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

Wir beobachten (nA = 39, nL = 38):

xA = 25,9, sA = 2,2, unser Schatzwert fur die Streung von xA istalso fA = sA = 2,2/

√nA = 0,36 (Standardfehler),

xL = 28,4, sL = 4,3,

unser Schatzwert fur die Streung von xL istalso fL = sL = 4,3/

√nL = 0,70.

Ist die beobachtete Abweichung xL − xA = 2,5 mit derNullhypothese vertraglich, dass µL = µA?

Da die Stichproben von zwei verschiedenen Arten kommen,beinhaltet unsere Nullhypothese diesmal nicht, dass beide aus

der selben Verteilung kommen. Wir wollten also hier nichtvoraussetzen, dass beide Arten die selbe Varianzen bei den

Zahngroßen haben.

Page 46: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

Wir beobachten (nA = 39, nL = 38):

xA = 25,9, sA = 2,2, unser Schatzwert fur die Streung von xA istalso fA = sA = 2,2/

√nA = 0,36 (Standardfehler),

xL = 28,4, sL = 4,3, unser Schatzwert fur die Streung von xL istalso fL = sL = 4,3/

√nL = 0,70.

Ist die beobachtete Abweichung xL − xA = 2,5 mit derNullhypothese vertraglich, dass µL = µA?

Da die Stichproben von zwei verschiedenen Arten kommen,beinhaltet unsere Nullhypothese diesmal nicht, dass beide aus

der selben Verteilung kommen. Wir wollten also hier nichtvoraussetzen, dass beide Arten die selbe Varianzen bei den

Zahngroßen haben.

Page 47: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

Wir beobachten (nA = 39, nL = 38):

xA = 25,9, sA = 2,2, unser Schatzwert fur die Streung von xA istalso fA = sA = 2,2/

√nA = 0,36 (Standardfehler),

xL = 28,4, sL = 4,3, unser Schatzwert fur die Streung von xL istalso fL = sL = 4,3/

√nL = 0,70.

Ist die beobachtete Abweichung xL − xA = 2,5 mit derNullhypothese vertraglich, dass µL = µA?

Da die Stichproben von zwei verschiedenen Arten kommen,beinhaltet unsere Nullhypothese diesmal nicht, dass beide aus

der selben Verteilung kommen. Wir wollten also hier nichtvoraussetzen, dass beide Arten die selbe Varianzen bei den

Zahngroßen haben.

Page 48: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

Wir beobachten (nA = 39, nL = 38):

xA = 25,9, sA = 2,2, unser Schatzwert fur die Streung von xA istalso fA = sA = 2,2/

√nA = 0,36 (Standardfehler),

xL = 28,4, sL = 4,3, unser Schatzwert fur die Streung von xL istalso fL = sL = 4,3/

√nL = 0,70.

Ist die beobachtete Abweichung xL − xA = 2,5 mit derNullhypothese vertraglich, dass µL = µA?

Da die Stichproben von zwei verschiedenen Arten kommen,beinhaltet unsere Nullhypothese diesmal nicht, dass beide aus

der selben Verteilung kommen. Wir wollten also hier nichtvoraussetzen, dass beide Arten die selbe Varianzen bei den

Zahngroßen haben.

Page 49: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

t-Statistik

Ist die beobachtete Abweichung xL − xA = 2,5 mit derNullhypothese vertraglich, dass µL = µA?

Wir schatzen die Streuung von xL − xA durch f , wo

f 2 = f 2L + f 2

A

und bilden t =xL − xA

f.

Wenn die Nullhypothese zutrifft, ist t (approximativ)Student-verteilt mit g Freiheitsgraden(wobei g aus den Daten geschatzt wird.)

Page 50: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

t-Statistik

Ist die beobachtete Abweichung xL − xA = 2,5 mit derNullhypothese vertraglich, dass µL = µA?

Wir schatzen die Streuung von xL − xA durch f , wo

f 2 = f 2L + f 2

A

und bilden t =xL − xA

f.

Wenn die Nullhypothese zutrifft, ist t (approximativ)Student-verteilt mit g Freiheitsgraden(wobei g aus den Daten geschatzt wird.)

Page 51: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

t-Statistik

Ist die beobachtete Abweichung xL − xA = 2,5 mit derNullhypothese vertraglich, dass µL = µA?

Wir schatzen die Streuung von xL − xA durch f , wo

f 2 = f 2L + f 2

A

und bilden t =xL − xA

f.

Wenn die Nullhypothese zutrifft, ist t (approximativ)Student-verteilt mit g Freiheitsgraden(wobei g aus den Daten geschatzt wird.)

Page 52: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

t-Statistik

Ist die beobachtete Abweichung xL − xA = 2,5 mit derNullhypothese vertraglich, dass µL = µA?

Wir schatzen die Streuung von xL − xA durch f , wo

f 2 = f 2L + f 2

A

und bilden t =xL − xA

f.

Wenn die Nullhypothese zutrifft, ist t (approximativ)Student-verteilt mit g Freiheitsgraden(wobei g aus den Daten geschatzt wird.)

Page 53: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

Theorem (Welch-t-Test, die Varianzen durfen ungleich sein)Seien X1, . . . , Xn und Y1, . . . , Ym unabhangige normalverteilteZufallsvariablen mit (moglicherweise verschiedenen) VarianzenVarXi = σ2

X und VarYi = σ2Y . Seien sX und sY die aus den

Stichproben berechneten Standardabweichungen. Unter derNullhypothese gleicher Mittelwerten EXi = EYj ist die Statistik

t =X − Y√

s2Xn +

s2Y

m

ungefahr t-verteilt mit

„s2Xn +

s2Ym

«2

s4X

n2·(n−1)+

s4Y

m2·(m−1)

Freiheitsgraden.

(Diese Approximation fur die Freiheitsgrade brauchen Sie sichnicht zu merken. R ubernimmt das fur Sie.)

Page 54: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

Theorem (Welch-t-Test, die Varianzen durfen ungleich sein)Seien X1, . . . , Xn und Y1, . . . , Ym unabhangige normalverteilteZufallsvariablen mit (moglicherweise verschiedenen) VarianzenVarXi = σ2

X und VarYi = σ2Y . Seien sX und sY die aus den

Stichproben berechneten Standardabweichungen. Unter derNullhypothese gleicher Mittelwerten EXi = EYj ist die Statistik

t =X − Y√

s2Xn +

s2Y

m

ungefahr t-verteilt mit

„s2Xn +

s2Ym

«2

s4X

n2·(n−1)+

s4Y

m2·(m−1)

Freiheitsgraden.

(Diese Approximation fur die Freiheitsgrade brauchen Sie sichnicht zu merken. R ubernimmt das fur Sie.)

Page 55: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

Zwei-Stichproben-t-Test mit R

> A <- md[Art=="africanum"]

> L <- md[Art=="libycum"]

> t.test(L,A)

Welch Two Sample t-test

data: L and A

t = 3.2043, df = 54.975, p-value = 0.002255

alternative hypothesis: true difference in means

is not equal to 0

95 percent confidence interval:

0.9453745 4.1025338

sample estimates:

mean of x mean of y

28.43421 25.91026

Page 56: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Wenn die Varianzen ungleich sein k’onnten

Formulierung:

”Die mittlere mesiodistale Langewar signifikant großer (28,4 mm) bei H. libycum

als bei H. africanum (25,9 mm)(t-Test, p = 0,002).“

Page 57: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Power eines Tests

Inhalt

1 Wiederholung: t-Test fur gepaarte Stichproben

2 t-Test fur ungepaarte StichprobenAngenommen, die Varianzen sind gleichWenn die Varianzen ungleich sein k’onntenPower eines TestsVergleich: gepaarter t-Test und ungepaarter t-Test

3 Wilcoxons RangsummentestMotivationWilcoxon-Test fur unabhangige Stichproben

4 Zusammenfassung

Page 58: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Power eines Tests

Testpower bzw. Testmacht

Salopp gesprochen ist diePower oder Macht eines Tests

die Wahrscheinlichkeit, die Nullhypothese abzulehnen,falls die Alternative zutrifft.

Bei einer einelementigen Alternativeist dies leicht zu formulieren: H0 : µ = 0

H1 : µ = m1

Die Testpower (oder auch Testmacht) ist dann definiert alsPrH1(Nullhypothese wird abgelehnt)

Page 59: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Power eines Tests

Testpower bzw. Testmacht

Salopp gesprochen ist diePower oder Macht eines Tests

die Wahrscheinlichkeit, die Nullhypothese abzulehnen,falls die Alternative zutrifft.

Bei einer einelementigen Alternativeist dies leicht zu formulieren: H0 : µ = 0

H1 : µ = m1

Die Testpower (oder auch Testmacht) ist dann definiert alsPrH1(Nullhypothese wird abgelehnt)

Page 60: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Power eines Tests

Testpower bzw. Testmacht

Salopp gesprochen ist diePower oder Macht eines Tests

die Wahrscheinlichkeit, die Nullhypothese abzulehnen,falls die Alternative zutrifft.

Bei einer einelementigen Alternativeist dies leicht zu formulieren: H0 : µ = 0

H1 : µ = m1

Die Testpower (oder auch Testmacht) ist dann definiert alsPrH1(Nullhypothese wird abgelehnt)

Page 61: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Power eines Tests

Warum interessiert uns die Testmacht?

Im Extremfall ist die Testmacht gleich 0,dann wird die Nullhypothese nie abgelehnt.

Somit konnen wir unsere Vermutung nicht stutzen.

Je großer die Testmacht,desto wahrscheinlicher wird die Nullhypothese abgelehnt.

Beachte: Die Testmacht hangt starkvon der Stichprobenlange ab.

In der Praxis muss man sich bereits vor VersuchsbeginnGedanken machen, wie groß die Stichprobenlange sein muss,

damit man die Vermutung stutzen kann.

Page 62: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Power eines Tests

Warum interessiert uns die Testmacht?

Im Extremfall ist die Testmacht gleich 0,dann wird die Nullhypothese nie abgelehnt.

Somit konnen wir unsere Vermutung nicht stutzen.

Je großer die Testmacht,desto wahrscheinlicher wird die Nullhypothese abgelehnt.

Beachte: Die Testmacht hangt starkvon der Stichprobenlange ab.

In der Praxis muss man sich bereits vor VersuchsbeginnGedanken machen, wie groß die Stichprobenlange sein muss,

damit man die Vermutung stutzen kann.

Page 63: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Power eines Tests

Warum interessiert uns die Testmacht?

Im Extremfall ist die Testmacht gleich 0,dann wird die Nullhypothese nie abgelehnt.

Somit konnen wir unsere Vermutung nicht stutzen.

Je großer die Testmacht,desto wahrscheinlicher wird die Nullhypothese abgelehnt.

Beachte: Die Testmacht hangt starkvon der Stichprobenlange ab.

In der Praxis muss man sich bereits vor VersuchsbeginnGedanken machen, wie groß die Stichprobenlange sein muss,

damit man die Vermutung stutzen kann.

Page 64: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Power eines Tests

Warum interessiert uns die Testmacht?

Im Extremfall ist die Testmacht gleich 0,dann wird die Nullhypothese nie abgelehnt.

Somit konnen wir unsere Vermutung nicht stutzen.

Je großer die Testmacht,desto wahrscheinlicher wird die Nullhypothese abgelehnt.

Beachte: Die Testmacht hangt starkvon der Stichprobenlange ab.

In der Praxis muss man sich bereits vor VersuchsbeginnGedanken machen, wie groß die Stichprobenlange sein muss,

damit man die Vermutung stutzen kann.

Page 65: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Vergleich: gepaarter t-Test und ungepaarter t-Test

Inhalt

1 Wiederholung: t-Test fur gepaarte Stichproben

2 t-Test fur ungepaarte StichprobenAngenommen, die Varianzen sind gleichWenn die Varianzen ungleich sein k’onntenPower eines TestsVergleich: gepaarter t-Test und ungepaarter t-Test

3 Wilcoxons RangsummentestMotivationWilcoxon-Test fur unabhangige Stichproben

4 Zusammenfassung

Page 66: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Vergleich: gepaarter t-Test und ungepaarter t-Test

Wann gepaarter t-Test (paired=TRUE) undwann ungepaarter t-Test (paired=FALSE)?

Wenn die Stichprobenlange unterschiedlich ist,macht ”gepaart“ keinen Sinn (R gibt Fehler aus).

Wenn die Stichprobenlange gleich ist:Sind die Stichproben unabhangig voneinander?Falls ja, dann paired=FALSE,da wegen der hoheren Zahl an Freiheitsgraden die Powergroßer ist.Sind die Stichproben voneinander abhangig?(z.B. Messungen von denselben Individuen bzw. Objekten)Falls ja, dann paired=TRUE.Bei starker Abhangigkeitsstruktur hat der gepaarte t-Testhohere Testpower (da der Test von Variabilitat zwischenden Individuen bereinigt ist)

Page 67: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Vergleich: gepaarter t-Test und ungepaarter t-Test

Wann gepaarter t-Test (paired=TRUE) undwann ungepaarter t-Test (paired=FALSE)?

Wenn die Stichprobenlange unterschiedlich ist,macht ”gepaart“ keinen Sinn (R gibt Fehler aus).

Wenn die Stichprobenlange gleich ist:Sind die Stichproben unabhangig voneinander?Falls ja, dann paired=FALSE,da wegen der hoheren Zahl an Freiheitsgraden die Powergroßer ist.Sind die Stichproben voneinander abhangig?(z.B. Messungen von denselben Individuen bzw. Objekten)Falls ja, dann paired=TRUE.Bei starker Abhangigkeitsstruktur hat der gepaarte t-Testhohere Testpower (da der Test von Variabilitat zwischenden Individuen bereinigt ist)

Page 68: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Vergleich: gepaarter t-Test und ungepaarter t-Test

Wann gepaarter t-Test (paired=TRUE) undwann ungepaarter t-Test (paired=FALSE)?

Wenn die Stichprobenlange unterschiedlich ist,macht ”gepaart“ keinen Sinn (R gibt Fehler aus).

Wenn die Stichprobenlange gleich ist:Sind die Stichproben unabhangig voneinander?Falls ja, dann paired=FALSE,da wegen der hoheren Zahl an Freiheitsgraden die Powergroßer ist.

Sind die Stichproben voneinander abhangig?(z.B. Messungen von denselben Individuen bzw. Objekten)Falls ja, dann paired=TRUE.Bei starker Abhangigkeitsstruktur hat der gepaarte t-Testhohere Testpower (da der Test von Variabilitat zwischenden Individuen bereinigt ist)

Page 69: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

t-Test fur ungepaarte Stichproben Vergleich: gepaarter t-Test und ungepaarter t-Test

Wann gepaarter t-Test (paired=TRUE) undwann ungepaarter t-Test (paired=FALSE)?

Wenn die Stichprobenlange unterschiedlich ist,macht ”gepaart“ keinen Sinn (R gibt Fehler aus).

Wenn die Stichprobenlange gleich ist:Sind die Stichproben unabhangig voneinander?Falls ja, dann paired=FALSE,da wegen der hoheren Zahl an Freiheitsgraden die Powergroßer ist.Sind die Stichproben voneinander abhangig?(z.B. Messungen von denselben Individuen bzw. Objekten)Falls ja, dann paired=TRUE.Bei starker Abhangigkeitsstruktur hat der gepaarte t-Testhohere Testpower (da der Test von Variabilitat zwischenden Individuen bereinigt ist)

Page 70: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest

Inhalt

1 Wiederholung: t-Test fur gepaarte Stichproben

2 t-Test fur ungepaarte StichprobenAngenommen, die Varianzen sind gleichWenn die Varianzen ungleich sein k’onntenPower eines TestsVergleich: gepaarter t-Test und ungepaarter t-Test

3 Wilcoxons RangsummentestMotivationWilcoxon-Test fur unabhangige Stichproben

4 Zusammenfassung

Page 71: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Motivation

Inhalt

1 Wiederholung: t-Test fur gepaarte Stichproben

2 t-Test fur ungepaarte StichprobenAngenommen, die Varianzen sind gleichWenn die Varianzen ungleich sein k’onntenPower eines TestsVergleich: gepaarter t-Test und ungepaarter t-Test

3 Wilcoxons RangsummentestMotivationWilcoxon-Test fur unabhangige Stichproben

4 Zusammenfassung

Page 72: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Motivation

Bei (ungefahr) glockenformigen undsymmetrisch verteilten Beobachtungen

oder wenn die Stichprobenumfange genugend groß sindkonnen wir den t-Test benutzen,

um die Nullhypothese µ1 = µ2 zu testen:Die t-Statistik ist (annahrend) Student-verteilt.

Besonders bei sehr asymmetrischen undlangschwanzigen Verteilungen

kann das anders sein

Page 73: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Motivation

Bei (ungefahr) glockenformigen undsymmetrisch verteilten Beobachtungen

oder wenn die Stichprobenumfange genugend groß sindkonnen wir den t-Test benutzen,

um die Nullhypothese µ1 = µ2 zu testen:Die t-Statistik ist (annahrend) Student-verteilt.

Besonders bei sehr asymmetrischen undlangschwanzigen Verteilungen

kann das anders sein

Page 74: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Motivation

Nehmen wir an, wir sollten folgende Verteilungen vergleichen:

x

Häu

figke

it

0 20 40 60 80 100 120

05

1015

20

Page 75: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Motivation

Nehmen wir an, wir sollten folgende Verteilungen vergleichen:

y

Häu

figke

it

0 20 40 60 80 100 120

05

1015

20

Page 76: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Motivation

Beispiele

WartezeitenAusbreitungsentfernungenZelltypenhaufigkeiten

Gesucht:

ein ”verteilungsfreier“ Testmit dem man die Lage zweier Verteilungen

zueinander testen kann

Page 77: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Motivation

BeispieleWartezeiten

AusbreitungsentfernungenZelltypenhaufigkeiten

Gesucht:

ein ”verteilungsfreier“ Testmit dem man die Lage zweier Verteilungen

zueinander testen kann

Page 78: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Motivation

BeispieleWartezeitenAusbreitungsentfernungen

Zelltypenhaufigkeiten

Gesucht:

ein ”verteilungsfreier“ Testmit dem man die Lage zweier Verteilungen

zueinander testen kann

Page 79: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Motivation

BeispieleWartezeitenAusbreitungsentfernungenZelltypenhaufigkeiten

Gesucht:

ein ”verteilungsfreier“ Testmit dem man die Lage zweier Verteilungen

zueinander testen kann

Page 80: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Motivation

BeispieleWartezeitenAusbreitungsentfernungenZelltypenhaufigkeiten

Gesucht:

ein ”verteilungsfreier“ Testmit dem man die Lage zweier Verteilungen

zueinander testen kann

Page 81: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Inhalt

1 Wiederholung: t-Test fur gepaarte Stichproben

2 t-Test fur ungepaarte StichprobenAngenommen, die Varianzen sind gleichWenn die Varianzen ungleich sein k’onntenPower eines TestsVergleich: gepaarter t-Test und ungepaarter t-Test

3 Wilcoxons RangsummentestMotivationWilcoxon-Test fur unabhangige Stichproben

4 Zusammenfassung

Page 82: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Beobachtungen: Zwei StichprobenX : x1, x2, . . . , xm

Y : y1, y2, . . . , yn

Wir mochten die Nullhypothese:X und Y aus derselben Population

(X und Y haben diesselbe Verteilung)testen.

Alternative:Die beiden Verteilungen sind gegeneinander verschoben.

Voraussetzung des Tests:Die beiden Verteilungen haben diesselbe Form,

sind also bis auf eine Lageverschiebung (in etwa) identisch.

Page 83: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Beobachtungen: Zwei StichprobenX : x1, x2, . . . , xm

Y : y1, y2, . . . , yn

Wir mochten die Nullhypothese:X und Y aus derselben Population

(X und Y haben diesselbe Verteilung)testen.

Alternative:Die beiden Verteilungen sind gegeneinander verschoben.

Voraussetzung des Tests:Die beiden Verteilungen haben diesselbe Form,

sind also bis auf eine Lageverschiebung (in etwa) identisch.

Page 84: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Beobachtungen: Zwei StichprobenX : x1, x2, . . . , xm

Y : y1, y2, . . . , yn

Wir mochten die Nullhypothese:X und Y aus derselben Population

(X und Y haben diesselbe Verteilung)testen.

Alternative:Die beiden Verteilungen sind gegeneinander verschoben.

Voraussetzung des Tests:Die beiden Verteilungen haben diesselbe Form,

sind also bis auf eine Lageverschiebung (in etwa) identisch.

Page 85: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Beobachtungen: Zwei StichprobenX : x1, x2, . . . , xm

Y : y1, y2, . . . , yn

Wir mochten die Nullhypothese:X und Y aus derselben Population

(X und Y haben diesselbe Verteilung)testen.

Alternative:Die beiden Verteilungen sind gegeneinander verschoben.

Voraussetzung des Tests:Die beiden Verteilungen haben diesselbe Form,

sind also bis auf eine Lageverschiebung (in etwa) identisch.

Page 86: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Idee

Beobachtungen:X : x1, x2, . . . , xm

Y : y1, y2, . . . , yn

Sortiere alle Beobachtungen der Große nach.Bestimme die Range der m X -Werte unter allen m + nBeobachtungen.Wenn die Nullhypothese zutrifft, sind die m X -Range einerein zufallige Wahl aus {1, 2, . . . , m + n}.Berechne die Summe der X -Range, prufe, ob dieser Wertuntypisch groß oder klein.

Page 87: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Idee

Beobachtungen:X : x1, x2, . . . , xm

Y : y1, y2, . . . , yn

Sortiere alle Beobachtungen der Große nach.

Bestimme die Range der m X -Werte unter allen m + nBeobachtungen.Wenn die Nullhypothese zutrifft, sind die m X -Range einerein zufallige Wahl aus {1, 2, . . . , m + n}.Berechne die Summe der X -Range, prufe, ob dieser Wertuntypisch groß oder klein.

Page 88: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Idee

Beobachtungen:X : x1, x2, . . . , xm

Y : y1, y2, . . . , yn

Sortiere alle Beobachtungen der Große nach.Bestimme die Range der m X -Werte unter allen m + nBeobachtungen.

Wenn die Nullhypothese zutrifft, sind die m X -Range einerein zufallige Wahl aus {1, 2, . . . , m + n}.Berechne die Summe der X -Range, prufe, ob dieser Wertuntypisch groß oder klein.

Page 89: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Idee

Beobachtungen:X : x1, x2, . . . , xm

Y : y1, y2, . . . , yn

Sortiere alle Beobachtungen der Große nach.Bestimme die Range der m X -Werte unter allen m + nBeobachtungen.Wenn die Nullhypothese zutrifft, sind die m X -Range einerein zufallige Wahl aus {1, 2, . . . , m + n}.

Berechne die Summe der X -Range, prufe, ob dieser Wertuntypisch groß oder klein.

Page 90: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Idee

Beobachtungen:X : x1, x2, . . . , xm

Y : y1, y2, . . . , yn

Sortiere alle Beobachtungen der Große nach.Bestimme die Range der m X -Werte unter allen m + nBeobachtungen.Wenn die Nullhypothese zutrifft, sind die m X -Range einerein zufallige Wahl aus {1, 2, . . . , m + n}.Berechne die Summe der X -Range, prufe, ob dieser Wertuntypisch groß oder klein.

Page 91: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Wilcoxons Rangsummenstatistik

Beobachtungen:X : x1, x2, . . . , xm

Y : y1, y2, . . . , yn

Frank Wilcoxon,1892-1965

W = Summe der X -Range− (1 + 2 + · · ·+ m)heißt

Wilcoxons Rangsummenstatistik

Page 92: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Wilcoxons Rangsummenstatistik

Bemerkung:

W = Summe der X -Range− (1 + 2 + · · ·+ m)

Wir konnten auch die Summe der Y -Range benutzen,

denn

Summe der X -Range + Summe der Y -Range= Summe aller Range

= 1 + 2 + · · ·+ (m + n) =(m + n)(m + n + 1)

2

Bemerkung

Der Wilcoxon Test heißt auch Mann-Whitney- Test.Die Mann-Whitney Statistik U = W + Konstante.

Page 93: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Wilcoxons Rangsummenstatistik

Bemerkung:

W = Summe der X -Range− (1 + 2 + · · ·+ m)

Wir konnten auch die Summe der Y -Range benutzen, denn

Summe der X -Range + Summe der Y -Range= Summe aller Range

= 1 + 2 + · · ·+ (m + n) =(m + n)(m + n + 1)

2

Bemerkung

Der Wilcoxon Test heißt auch Mann-Whitney- Test.Die Mann-Whitney Statistik U = W + Konstante.

Page 94: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Wilcoxons Rangsummenstatistik

Bemerkung:

W = Summe der X -Range− (1 + 2 + · · ·+ m)

Wir konnten auch die Summe der Y -Range benutzen, denn

Summe der X -Range + Summe der Y -Range= Summe aller Range

= 1 + 2 + · · ·+ (m + n) =(m + n)(m + n + 1)

2

Bemerkung

Der Wilcoxon Test heißt auch Mann-Whitney- Test.Die Mann-Whitney Statistik U = W + Konstante.

Page 95: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Ein kleines Beispiel

Beobachtungen:

X : 1,5; 5,6; 35,2Y : 7,9; 38,1; 41,0; 56,7; 112,1; 197,4; 381,8

Lege Beobachtungen zusammen und sortiere:1,5; 5,6; 7,9; 35,2; 38,1; 41,0; 56,7; 112,1; 197,4; 381,8

Bestimme Range:1, 2, 3, 4, 5, 6, 7, 8, 9, 10

Rangsumme: W = 1 + 2 + 4− (1 + 2 + 3) = 1

Page 96: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Ein kleines Beispiel

Beobachtungen:

X : 1,5; 5,6; 35,2Y : 7,9; 38,1; 41,0; 56,7; 112,1; 197,4; 381,8

Lege Beobachtungen zusammen und sortiere:1,5; 5,6; 7,9; 35,2; 38,1; 41,0; 56,7; 112,1; 197,4; 381,8

Bestimme Range:1, 2, 3, 4, 5, 6, 7, 8, 9, 10

Rangsumme: W = 1 + 2 + 4− (1 + 2 + 3) = 1

Page 97: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Ein kleines Beispiel

Beobachtungen:

X : 1,5; 5,6; 35,2Y : 7,9; 38,1; 41,0; 56,7; 112,1; 197,4; 381,8

Lege Beobachtungen zusammen und sortiere:1,5; 5,6; 7,9; 35,2; 38,1; 41,0; 56,7; 112,1; 197,4; 381,8

Bestimme Range:1, 2, 3, 4, 5, 6, 7, 8, 9, 10

Rangsumme: W = 1 + 2 + 4− (1 + 2 + 3) = 1

Page 98: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Ein kleines Beispiel

Beobachtungen:

X : 1,5; 5,6; 35,2Y : 7,9; 38,1; 41,0; 56,7; 112,1; 197,4; 381,8

Lege Beobachtungen zusammen und sortiere:1,5; 5,6; 7,9; 35,2; 38,1; 41,0; 56,7; 112,1; 197,4; 381,8

Bestimme Range:1, 2, 3, 4, 5, 6, 7, 8, 9, 10

Rangsumme: W = 1 + 2 + 4− (1 + 2 + 3) = 1

Page 99: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Interpretation von W

X -Population kleiner =⇒ W klein:

1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 01, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 11, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 21, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 2

X -Population großer =⇒ W groß:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 211, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 201, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 191, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 19

Page 100: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Interpretation von W

X -Population kleiner =⇒ W klein:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 0

1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 11, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 21, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 2

X -Population großer =⇒ W groß:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 211, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 201, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 191, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 19

Page 101: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Interpretation von W

X -Population kleiner =⇒ W klein:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 01, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 1

1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 21, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 2

X -Population großer =⇒ W groß:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 211, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 201, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 191, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 19

Page 102: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Interpretation von W

X -Population kleiner =⇒ W klein:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 01, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 11, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 2

1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 2

X -Population großer =⇒ W groß:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 211, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 201, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 191, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 19

Page 103: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Interpretation von W

X -Population kleiner =⇒ W klein:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 01, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 11, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 21, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 2

X -Population großer =⇒ W groß:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 211, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 201, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 191, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 19

Page 104: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Interpretation von W

X -Population kleiner =⇒ W klein:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 01, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 11, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 21, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 2

X -Population großer =⇒ W groß:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W =

211, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 201, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 191, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 19

Page 105: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Interpretation von W

X -Population kleiner =⇒ W klein:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 01, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 11, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 21, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 2

X -Population großer =⇒ W groß:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 21

1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 201, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 191, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 19

Page 106: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Interpretation von W

X -Population kleiner =⇒ W klein:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 01, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 11, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 21, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 2

X -Population großer =⇒ W groß:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 211, 2, 3, 4, 5, 6, 7, 8, 9, 10 W =

201, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 191, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 19

Page 107: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Interpretation von W

X -Population kleiner =⇒ W klein:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 01, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 11, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 21, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 2

X -Population großer =⇒ W groß:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 211, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 20

1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 191, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 19

Page 108: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Interpretation von W

X -Population kleiner =⇒ W klein:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 01, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 11, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 21, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 2

X -Population großer =⇒ W groß:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 211, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 201, 2, 3, 4, 5, 6, 7, 8, 9, 10 W =

191, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 19

Page 109: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Interpretation von W

X -Population kleiner =⇒ W klein:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 01, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 11, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 21, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 2

X -Population großer =⇒ W groß:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 211, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 201, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 19

1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 19

Page 110: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Interpretation von W

X -Population kleiner =⇒ W klein:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 01, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 11, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 21, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 2

X -Population großer =⇒ W groß:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 211, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 201, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 191, 2, 3, 4, 5, 6, 7, 8, 9, 10 W =

19

Page 111: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Interpretation von W

X -Population kleiner =⇒ W klein:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 01, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 11, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 21, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 2

X -Population großer =⇒ W groß:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 211, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 201, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 191, 2, 3, 4, 5, 6, 7, 8, 9, 10 W = 19

Page 112: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Signifikanz

Nullhypothese:X -Stichprobe und Y -Stichprobe

stammen ausderselben Verteilung

Die 3 Range der X -Stichprobe1 2 3 4 5 6 7 8 9 10

hatten genausogut irgendwelche 3 Range1 2 3 4 5 6 7 8 9 10

sein konnen.

Es gibt 10·9·83·2·1 = 120 Moglichkeiten.

(Allgemein: (m+n)(m+n−1)···(n+1)m(m−1)···1 ) = (m+n)!

n!m! =(m+n

m

)Moglichkeiten)

Page 113: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Signifikanz

Nullhypothese:X -Stichprobe und Y -Stichprobe

stammen ausderselben Verteilung

Die 3 Range der X -Stichprobe1 2 3 4 5 6 7 8 9 10

hatten genausogut irgendwelche 3 Range1 2 3 4 5 6 7 8 9 10

sein konnen.

Es gibt 10·9·83·2·1 = 120 Moglichkeiten.

(Allgemein: (m+n)(m+n−1)···(n+1)m(m−1)···1 ) = (m+n)!

n!m! =(m+n

m

)Moglichkeiten)

Page 114: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Signifikanz

Nullhypothese:X -Stichprobe und Y -Stichprobe

stammen ausderselben Verteilung

Die 3 Range der X -Stichprobe1 2 3 4 5 6 7 8 9 10

hatten genausogut irgendwelche 3 Range

1 2 3 4 5 6 7 8 9 10sein konnen.

Es gibt 10·9·83·2·1 = 120 Moglichkeiten.

(Allgemein: (m+n)(m+n−1)···(n+1)m(m−1)···1 ) = (m+n)!

n!m! =(m+n

m

)Moglichkeiten)

Page 115: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Signifikanz

Nullhypothese:X -Stichprobe und Y -Stichprobe

stammen ausderselben Verteilung

Die 3 Range der X -Stichprobe1 2 3 4 5 6 7 8 9 10

hatten genausogut irgendwelche 3 Range1 2 3 4 5 6 7 8 9 10

sein konnen.

Es gibt 10·9·83·2·1 = 120 Moglichkeiten.

(Allgemein: (m+n)(m+n−1)···(n+1)m(m−1)···1 ) = (m+n)!

n!m! =(m+n

m

)Moglichkeiten)

Page 116: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Signifikanz

Nullhypothese:X -Stichprobe und Y -Stichprobe

stammen ausderselben Verteilung

Die 3 Range der X -Stichprobe1 2 3 4 5 6 7 8 9 10

hatten genausogut irgendwelche 3 Range1 2 3 4 5 6 7 8 9 10

sein konnen.

Es gibt 10·9·83·2·1 = 120 Moglichkeiten.

(Allgemein: (m+n)(m+n−1)···(n+1)m(m−1)···1 ) = (m+n)!

n!m! =(m+n

m

)Moglichkeiten)

Page 117: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Signifikanz

Nullhypothese:X -Stichprobe und Y -Stichprobe

stammen ausderselben Verteilung

Die 3 Range der X -Stichprobe1 2 3 4 5 6 7 8 9 10

hatten genausogut irgendwelche 3 Range1 2 3 4 5 6 7 8 9 10

sein konnen.

Es gibt 10·9·83·2·1 = 120 Moglichkeiten.

(Allgemein: (m+n)(m+n−1)···(n+1)m(m−1)···1 ) = (m+n)!

n!m! =(m+n

m

)Moglichkeiten)

Page 118: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Verteilung der Wilcoxon-Statistik (m = 3, n = 7)

0 2 4 6 8 10 13 16 19

W

Mög

lichk

eite

n

02

46

810

Page 119: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Unter der Nullhypothese sind alle Rangbelegungen gleichwahrscheinlich, also

Pr(W = w) =Anz. Moglichkeiten mit Rangsummenstatistik w

120

Wir beobachten in unserem Beispiel:1,5, 5,6; 7,9; 35,2; 38,1; 41,0; 56,7; 112,1; 197,4; 381,8

somit W = 1

Pr(W ≤ 1) + Pr(W ≥ 20)= Pr(W = 0) + Pr(W = 1) + Pr(W = 20) + Pr(W = 21)

= 1+1+1+1120

·= 0,033

Page 120: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Unter der Nullhypothese sind alle Rangbelegungen gleichwahrscheinlich, also

Pr(W = w) =Anz. Moglichkeiten mit Rangsummenstatistik w

120

Wir beobachten in unserem Beispiel:1,5, 5,6; 7,9; 35,2; 38,1; 41,0; 56,7; 112,1; 197,4; 381,8

somit W = 1

Pr(W ≤ 1) + Pr(W ≥ 20)= Pr(W = 0) + Pr(W = 1) + Pr(W = 20) + Pr(W = 21)

= 1+1+1+1120

·= 0,033

Page 121: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Unter der Nullhypothese sind alle Rangbelegungen gleichwahrscheinlich, also

Pr(W = w) =Anz. Moglichkeiten mit Rangsummenstatistik w

120

Wir beobachten in unserem Beispiel:1,5, 5,6; 7,9; 35,2; 38,1; 41,0; 56,7; 112,1; 197,4; 381,8

somit W = 1

Pr(W ≤ 1) + Pr(W ≥ 20)= Pr(W = 0) + Pr(W = 1) + Pr(W = 20) + Pr(W = 21)

= 1+1+1+1120

·= 0,033

Page 122: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Verteilung der Wilcoxon-Statistik (m = 3, n = 7)

0 2 4 6 8 10 13 16 19

W

Wah

rsch

einl

ichk

eit

0.00

0.02

0.04

0.06

0.08

Page 123: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Fur unser Beispiel (W = 1) also:

p-Wert = Pr(ein so extremes W ) = 4/120 = 0,033

Wir lehnen die Nullhypothese,dass die Verteilungen

von X und Yidentisch sind,

auf dem 5%-Niveau ab.

Page 124: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Fur unser Beispiel (W = 1) also:

p-Wert = Pr(ein so extremes W ) = 4/120 = 0,033

Wir lehnen die Nullhypothese,dass die Verteilungen

von X und Yidentisch sind,

auf dem 5%-Niveau ab.

Page 125: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

R kennt den Wilcoxon-Test mittels wilcox.test:

> x

[1] 1.5 5.6 35.2

> y

[1] 7.9 38.1 41.0 56.7 112.1 197.4 381.8

> wilcox.test(x,y)

Wilcoxon rank sum test

data: x and y

W = 1, p-value = 0.03333

alternative hypothesis: true location shift is

not equal to 0

Page 126: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Achtung

Achtung!!!

Wenn der Wilcoxon-Test Signifikanz anzeigt,so kann das daran liegen, dass die zu grunde

liegenden Verteilungen verschiedene Formen haben.

Der Wilcoxon-Test kann beispielsweise Signifikanz anzeigen,selbst wenn die Stichproben-Mittelwerte ubereinstimmen!

Page 127: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Achtung

Achtung!!!

Wenn der Wilcoxon-Test Signifikanz anzeigt,so kann das daran liegen, dass die zu grunde

liegenden Verteilungen verschiedene Formen haben.

Der Wilcoxon-Test kann beispielsweise Signifikanz anzeigen,selbst wenn die Stichproben-Mittelwerte ubereinstimmen!

Page 128: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Vergleich von t-Test und Wilcoxon-TestSowohl der t-Test als auch der Wilcoxon-Test konnen verwendetwerden, um eine vermutete Verschiebung der Verteilung zustutzen.

Der Welch-t-Test testet ”nur“ auf Gleichheit derErwartungswerte. Der Wilcoxon-Test dagegen testet aufGleichheit der gesamten Verteilungen (so wie der2-Stichproben-t-Test mit gleichen Varianzen).

In vielen Fallen liefern beide Tests dasselbe Ergebnis.Sofern die Verteilungen einigermaßen glockenformig sind,empfehlen wir den Welch-t-Test.In besonderen Fallen

Verteilungen sind asymmetrischStichprobenlange ist klein

hat der Wilcoxon-Test eine hohere Testpower.

Page 129: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Vergleich von t-Test und Wilcoxon-TestSowohl der t-Test als auch der Wilcoxon-Test konnen verwendetwerden, um eine vermutete Verschiebung der Verteilung zustutzen.

Der Welch-t-Test testet ”nur“ auf Gleichheit derErwartungswerte.

Der Wilcoxon-Test dagegen testet aufGleichheit der gesamten Verteilungen (so wie der2-Stichproben-t-Test mit gleichen Varianzen).

In vielen Fallen liefern beide Tests dasselbe Ergebnis.Sofern die Verteilungen einigermaßen glockenformig sind,empfehlen wir den Welch-t-Test.In besonderen Fallen

Verteilungen sind asymmetrischStichprobenlange ist klein

hat der Wilcoxon-Test eine hohere Testpower.

Page 130: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Vergleich von t-Test und Wilcoxon-TestSowohl der t-Test als auch der Wilcoxon-Test konnen verwendetwerden, um eine vermutete Verschiebung der Verteilung zustutzen.

Der Welch-t-Test testet ”nur“ auf Gleichheit derErwartungswerte. Der Wilcoxon-Test dagegen testet aufGleichheit der gesamten Verteilungen (so wie der2-Stichproben-t-Test mit gleichen Varianzen).

In vielen Fallen liefern beide Tests dasselbe Ergebnis.Sofern die Verteilungen einigermaßen glockenformig sind,empfehlen wir den Welch-t-Test.In besonderen Fallen

Verteilungen sind asymmetrischStichprobenlange ist klein

hat der Wilcoxon-Test eine hohere Testpower.

Page 131: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Vergleich von t-Test und Wilcoxon-TestSowohl der t-Test als auch der Wilcoxon-Test konnen verwendetwerden, um eine vermutete Verschiebung der Verteilung zustutzen.

Der Welch-t-Test testet ”nur“ auf Gleichheit derErwartungswerte. Der Wilcoxon-Test dagegen testet aufGleichheit der gesamten Verteilungen (so wie der2-Stichproben-t-Test mit gleichen Varianzen).

In vielen Fallen liefern beide Tests dasselbe Ergebnis.Sofern die Verteilungen einigermaßen glockenformig sind,empfehlen wir den Welch-t-Test.

In besonderen FallenVerteilungen sind asymmetrischStichprobenlange ist klein

hat der Wilcoxon-Test eine hohere Testpower.

Page 132: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Vergleich von t-Test und Wilcoxon-TestSowohl der t-Test als auch der Wilcoxon-Test konnen verwendetwerden, um eine vermutete Verschiebung der Verteilung zustutzen.

Der Welch-t-Test testet ”nur“ auf Gleichheit derErwartungswerte. Der Wilcoxon-Test dagegen testet aufGleichheit der gesamten Verteilungen (so wie der2-Stichproben-t-Test mit gleichen Varianzen).

In vielen Fallen liefern beide Tests dasselbe Ergebnis.Sofern die Verteilungen einigermaßen glockenformig sind,empfehlen wir den Welch-t-Test.In besonderen Fallen

Verteilungen sind asymmetrischStichprobenlange ist klein

hat der Wilcoxon-Test eine hohere Testpower.

Page 133: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

Vergleichen wir (spaßeshalber) mit dem t-Test:

> x

[1] 1.5 5.6 35.2

> y

[1] 7.9 38.1 41.0 56.7 112.1 197.4 381.8

> t.test(x,y)

Welch Two Sample t-test

data: x and y

t = -2.0662, df = 6.518, p-value = 0.08061

alternative hypothesis: true difference in means is not equal to 0

95 percent confidence interval:

-227.39182 17.02039

sample estimates:

mean of x mean of y

14.1000 119.2857

Page 134: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Wilcoxons Rangsummentest Wilcoxon-Test fur unabhangige Stichproben

0 100 200 300

XY

Page 135: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Zusammenfassung

Inhalt

1 Wiederholung: t-Test fur gepaarte Stichproben

2 t-Test fur ungepaarte StichprobenAngenommen, die Varianzen sind gleichWenn die Varianzen ungleich sein k’onntenPower eines TestsVergleich: gepaarter t-Test und ungepaarter t-Test

3 Wilcoxons RangsummentestMotivationWilcoxon-Test fur unabhangige Stichproben

4 Zusammenfassung

Page 136: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Zusammenfassung

Wir untersuchen ein Merkmal in zwei Populationen:

Population 1 2Mittelwert µ1 µ2

Nullhypothese: µ1 = µ2

Wir ziehen Stichproben aus den Populationen mitStichproben-Mittelwertenx1 x2

Um die Nullhypothese H0 zu prufen, bilden wir im Zweifelsfall dieWelch-t-Statistik

t =x1 − x2

fmit f =

√( s1√n1

)2+

( s2√n2

)2

p-Wert unter H0: p ≈ Pr(|Tg| ≥ |t |)(g=(geschatzte) Anz. Freiheitsgrade, hangt von n1, n2, s1, s2 ab)

Page 137: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Zusammenfassung

Wir untersuchen ein Merkmal in zwei Populationen:Population 1 2Mittelwert µ1 µ2

Nullhypothese: µ1 = µ2

Wir ziehen Stichproben aus den Populationen mitStichproben-Mittelwertenx1 x2

Um die Nullhypothese H0 zu prufen, bilden wir im Zweifelsfall dieWelch-t-Statistik

t =x1 − x2

fmit f =

√( s1√n1

)2+

( s2√n2

)2

p-Wert unter H0: p ≈ Pr(|Tg| ≥ |t |)(g=(geschatzte) Anz. Freiheitsgrade, hangt von n1, n2, s1, s2 ab)

Page 138: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Zusammenfassung

Wir untersuchen ein Merkmal in zwei Populationen:Population 1 2Mittelwert µ1 µ2

Nullhypothese: µ1 = µ2

Wir ziehen Stichproben aus den Populationen mitStichproben-Mittelwertenx1 x2

Um die Nullhypothese H0 zu prufen, bilden wir im Zweifelsfall dieWelch-t-Statistik

t =x1 − x2

fmit f =

√( s1√n1

)2+

( s2√n2

)2

p-Wert unter H0: p ≈ Pr(|Tg| ≥ |t |)(g=(geschatzte) Anz. Freiheitsgrade, hangt von n1, n2, s1, s2 ab)

Page 139: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Zusammenfassung

Wir untersuchen ein Merkmal in zwei Populationen:Population 1 2Mittelwert µ1 µ2

Nullhypothese: µ1 = µ2

Wir ziehen Stichproben aus den Populationen mitStichproben-Mittelwertenx1 x2

Um die Nullhypothese H0 zu prufen, bilden wir im Zweifelsfall dieWelch-t-Statistik

t =x1 − x2

fmit f =

√( s1√n1

)2+

( s2√n2

)2

p-Wert unter H0: p ≈ Pr(|Tg| ≥ |t |)(g=(geschatzte) Anz. Freiheitsgrade, hangt von n1, n2, s1, s2 ab)

Page 140: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Zusammenfassung

Wir untersuchen ein Merkmal in zwei Populationen:Population 1 2Mittelwert µ1 µ2

Nullhypothese: µ1 = µ2

Wir ziehen Stichproben aus den Populationen mitStichproben-Mittelwertenx1 x2

Um die Nullhypothese H0 zu prufen, bilden wir im Zweifelsfall dieWelch-t-Statistik

t =x1 − x2

fmit f =

√( s1√n1

)2+

( s2√n2

)2

p-Wert unter H0: p ≈ Pr(|Tg| ≥ |t |)(g=(geschatzte) Anz. Freiheitsgrade, hangt von n1, n2, s1, s2 ab)

Page 141: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Zusammenfassung

Wir untersuchen ein Merkmal in zwei Populationen:Population 1 2Mittelwert µ1 µ2

Nullhypothese: µ1 = µ2

Wir ziehen Stichproben aus den Populationen mitStichproben-Mittelwertenx1 x2

Um die Nullhypothese H0 zu prufen, bilden wir im Zweifelsfall dieWelch-t-Statistik

t =x1 − x2

fmit f =

√( s1√n1

)2+

( s2√n2

)2

p-Wert unter H0: p ≈ Pr(|Tg| ≥ |t |)(g=(geschatzte) Anz. Freiheitsgrade, hangt von n1, n2, s1, s2 ab)

Page 142: Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨ 5 ...evol.bio.lmu.de/_statgen/StatBiol/11SS/zwei-stichproben-t-test... · Wahrscheinlichkeitsrechnung und Statistik fur Biologen¨

Zusammenfassung

Wenn die Normalverteilungsannahmen offensichtlich grobverletzt ist und die Nullhypothese nicht nur ist, dass die beidenMittelwerte gleich sind sondern dass die Stichproben aus derselben Verteilung kommen, konnen wirstattdessen den Wilcoxon-Test verwenden.