Analiza wariancji Opracowano na podstawie: Łomnicki A. 2003. Wprowadzenie do statystyki dla przyrodników. PWN Warszawa. 1 Analiza wariancji klasyfikacja prosta Dane o przeżywalności chrząszczy hodowanych hodowlanych na czterech różnych pożywkach. Każda pożywka stanowi grupę po 5 pomiarów. Interesuje nas odpowiedz na pytanie, czy skład pożywki ma wpływ przeżywalności chrząszczy. Jest model to I analizy wariancji, ponieważ czynnik różnicujący grupy (skład pożywki) jest czynnikiem powtarzalnym znajdującym się pod kontrolą eksperymentatora, a nie zmienną losową. Sposób przeprowadzenia obliczeń jest taki sam dla modelu I i II. Polega on na oszacowaniu wariancji między grupami i wewnątrz grup. X MP0 58 60 51 66 62 59,4 MP5 65 70 64 75 68 68,4 MP2 69 62 70 63 65 65,8 MPR 63 68 68 60 66 65,0 Dla tych danych będziemy testować hipotezę zerową zakładającą, że zróżnicowanie przeżywalności między grupami nie jest większe niż wewnątrz grup, czyli miedzy różnymi pożywkami nie ma różnicy w przeżywalności chrząszczy. Zgodnie z konwencją wskaźnikiem ij oznaczymy i -ty pomiar w j-tej grupie. W ten sposób drugi pomiar w trzeciej grupie (MP2) oznaczamy symbolem x 2,3 =62. W naszych danych są a=4 grupy, w każdej grupie j mamy N j =5 pomiarów, zatem we wszystkich grupach jest łącznie N=20 pomiarów. Aby otrzymać ogólną (całkowitą) sumę kwadratów odchyleń posłużymy się wzorem: a j N i a j N i ij ij j j N X X 2 2 (1) Pierwszy składnik wzoru (1) otrzymujemy podnosząc do kwadratu każdy z pomiarów, a następnie sumując wszystkie wyniki a j N i ij j X 84107 ) 66 ( ... ) 60 ( ) 58 ( 2 2 2 2 I II III IV V I 2 II 2 III 2 IV 2 V 5 MP0 58 60 51 66 62 3364 3600 2601 4356 3844 MP5 65 70 64 75 68 4225 4900 4096 5625 4624 MP2 69 62 70 63 65 4761 3844 4900 3969 4225 MPR 63 68 68 60 66 3969 4624 4624 3600 4356 1293 84107 Drugi składnik wzoru (1), czyli wyraz poprawkowy obliczamy sumując wszystkie pomiary, podnosząc je do kwadratu, a następnie dzieląc przez liczbę wszystkich pomiarów N. 45 , 83592 20 / 1671849 20 / ) 1293 ( 20 / ) 66 ... 60 58 ( / 2 2 2 N X a j N i ij j Zatem całkowita (ogólna) suma kwadratów odchyleń wynosi 84107-83592,45=514,55
9
Embed
Analiza wariancji klasyfikacja prosta - matrix.ur.krakow.plmatrix.ur.krakow.pl/~wberski/Stat/Analiza wariancji_tekst.pdf · otrzymanym stosunkiem F a otrzymaną statystyka związek
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Analiza wariancji Opracowano na podstawie: Łomnicki A. 2003. Wprowadzenie do statystyki dla przyrodników. PWN Warszawa.
1
Analiza wariancji klasyfikacja prosta
Dane o przeżywalności chrząszczy hodowanych hodowlanych na czterech różnych
pożywkach. Każda pożywka stanowi grupę po 5 pomiarów. Interesuje nas odpowiedz na
pytanie, czy skład pożywki ma wpływ przeżywalności chrząszczy. Jest model to I analizy
wariancji, ponieważ czynnik różnicujący grupy (skład pożywki) jest czynnikiem
powtarzalnym znajdującym się pod kontrolą eksperymentatora, a nie zmienną losową. Sposób
przeprowadzenia obliczeń jest taki sam dla modelu I i II. Polega on na oszacowaniu wariancji
między grupami i wewnątrz grup.
X MP0 58 60 51 66 62 59,4
MP5 65 70 64 75 68 68,4
MP2 69 62 70 63 65 65,8
MPR 63 68 68 60 66 65,0
Dla tych danych będziemy testować hipotezę zerową zakładającą, że zróżnicowanie
przeżywalności między grupami nie jest większe niż wewnątrz grup, czyli miedzy różnymi
pożywkami nie ma różnicy w przeżywalności chrząszczy.
Zgodnie z konwencją wskaźnikiem ij oznaczymy i-ty pomiar w j-tej grupie. W ten sposób
drugi pomiar w trzeciej grupie (MP2) oznaczamy symbolem x2,3=62.
W naszych danych są a=4 grupy, w każdej grupie j mamy Nj=5 pomiarów, zatem we
wszystkich grupach jest łącznie N=20 pomiarów.
Aby otrzymać ogólną (całkowitą) sumę kwadratów odchyleń posłużymy się wzorem:
a
j
N
i
a
j
N
i
ij
ij
j
j
N
X
X
2
2 (1)
Pierwszy składnik wzoru (1) otrzymujemy podnosząc do kwadratu każdy z pomiarów, a
następnie sumując wszystkie wyniki a
j
N
i
ij
j
X 84107)66(...)60()58( 2222
I II III IV V I2
II2
III2
IV2
V5
MP0 58 60 51 66 62 3364 3600 2601 4356 3844
MP5 65 70 64 75 68 4225 4900 4096 5625 4624
MP2 69 62 70 63 65 4761 3844 4900 3969 4225
MPR 63 68 68 60 66 3969 4624 4624 3600 4356
1293 84107
Drugi składnik wzoru (1), czyli wyraz poprawkowy obliczamy sumując wszystkie pomiary,
podnosząc je do kwadratu, a następnie dzieląc przez liczbę wszystkich pomiarów N.
45,8359220/167184920/)1293(20/)66...6058(/ 22
2
NXa
j
N
i
ij
j
Zatem całkowita (ogólna) suma kwadratów odchyleń wynosi 84107-83592,45=514,55
Analiza wariancji Opracowano na podstawie: Łomnicki A. 2003. Wprowadzenie do statystyki dla przyrodników. PWN Warszawa.
2
Międzygrupowa suma kwadratów odchyleń jest liczona według wzoru:
N
X
N
Xa
j
N
i
ija
j j
N
i
ij
jj22
(2)
Drugi składnik tego wzoru jest identyczny jak w wzorze (1) do obliczenia całkowitej sumy
kwadratów (jest to wyraz poprawkowy), został wcześniej wyliczony i wynosi 83592,45.
Pierwszy wyraz wzoru (2) otrzymujemy sumując wszystkie pomiary dla każdej grupy
osobno. Następnie każdą z tych sum podnosimy do kwadratu i dzielimy przez liczbę
pomiarów, na podstawie których została obliczona. Jeżeli liczba pomiarów w każdej grupie
jest różna, to zgodnie ze wzorem (2) dla każdej grupy dzielimy przez liczbę pomiarów Nj w
tej grupie
i i i i
iiii XXXX 325,329,342,297 4321
8,838075/)325(5/)329(5/)342(5/)297(/ 2222
3a
j
j
N
i
ij NXj
I II III IV V 2
2/Nj
MP0 58 60 51 66 62 297 88209 17641,8
MP5 65 70 64 75 68 342 116964 23392,8
MP2 69 62 70 63 65 329 108241 21648,2
MPR 63 68 68 60 66 325 105625 21125,0
1293 419039 83807,8
Zgodnie ze wzorem (2) międzygrupowa suma kwadratów odchyleń wynosi:
83807,8-83592,45=215,35
Suma kwadratów odchyleń (SK) równa się:
Ogólna SK = międzygrupowa SK + wewnątrzgrupowa SK
Wewnątrzgrupową suma kwadratów odchyleń (składnik błędu) oblicz się następująco:
Wewnątrzgrupowa SK = Ogólna SK - międzygrupowa SK
Czyli dla przykładu: 514,55 – 215,35=299,20
Liczba stopni swobody dla całkowitej SK wynosi: df=N-1 = 20-1=19, dla międzygrupowej
SK: df=a-1 = 4-1=3 a dla wewnątrzgrupowej SK:
df = a
i
jN 16)15()15()15()15()1(
Wzór ten pozwala obliczyć wewnątrzgrupowa liczbę stopni swobody nawet, gdy liczba