KAUNO TECHNOLOGIJOS UNIVERSITETAS FUNDAMENTALIŲJŲ MOKSLU FAKULTETAS TAIKOMOSIOS MATEMATIKOS KATEDRA P160D003 TAIKOMOSIOS STATISTIKOS METODAI IR PROGRAMINĖS PRIEMONĖS STATISTINĖS GALIOS ANALIZĖ Referatas Atliko: dokt. Aleksejus Michalkovič Priemė: doc. V. Janilionis
34
Embed
Pirmos ir antros rūšies klaidos · Web viewMatome, kad tikrinant hipotezę galime padaryti dviejų rūšių klaidas. Pirmos rūšies klaida yra gaunama, kai hipotezę H 0 atmetame,
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
KAUNO TECHNOLOGIJOS UNIVERSITETAS
FUNDAMENTALIŲJŲ MOKSLU FAKULTETAS
TAIKOMOSIOS MATEMATIKOS KATEDRA
P160D003 TAIKOMOSIOS STATISTIKOS METODAI IR PROGRAMINĖS
PRIEMONĖS
STATISTINĖS GALIOS ANALIZĖ
Referatas
Atliko: dokt. Aleksejus Michalkovič
Priemė: doc. V. Janilionis
KAUNAS, 2010
TurinysPirmos ir antros rūšies klaidos.........................................................................................................................................3
Statistinė galios analizė...................................................................................................................................................4
Programinė statistinės galios analizės realizacija SAS pakete.....................................................................................5
Matome, kad modelį sudaro 7 poveikiai, yra analizuojami 3 poveikiai, dalinė koreliacija yra 0,1,
imties dydis – 1 000, o statistinė galia yra nežinoma. Procedūros rezultatas yra toks:
7
Fixed Scenario ElementsMethod ExactNumber of Predictors in Full Model 7Number of Test Predictors 3Partial Correlation 0.1Total Sample Size 1000Model Random XAlpha 0.05
Computed PowerPower
.761
Matome, kad statistinė galia yra 0,761.
Ryšį taip kintamųjų taip pat galima nurodyti naudojant bet kokią kintamųjų RSQUAREFULL,
RSQUAREREDUCED, RSQUAREDIFF porą. Pasirinksime pirmuosius du kintamuosius. Tada sintaksė yra
Matome, kad bendrasis modelis paaiškina 80,12% sklaidos apie vidurkį, redukuotas modelis –
79,85% sklaidos pie vidurkį. Procedūros rezultatas yra:
Fixed Scenario ElementsMethod ExactNumber of Predictors in Full Model 7Number of Test Predictors 3R-square of Full Model 0.8012R-square of Reduced Model 0.7985Total Sample Size 1000Model Random XAlpha 0.05
Computed PowerPower0.882
Padidinkime imties dydį. Tarkime imtis turi 1500 stebėjimų. Tada turime tokį rezultatą:
Fixed Scenario ElementsMethod Exact
8
Number of Predictors in Full Model 7Number of Test Predictors 3Partial Correlatio 0.1Total Sample Size 1500Model Random XAlpha 0.05
Computed PowerPower0.918
Taigi statistinė galia yra 0,918. Kadangi šiuo atvėju galia yra pakankamai didelė, toks imties dydis
Fixed Scenario ElementsMethod ExactNumber of Predictors in Full Model 7Number of Test Predictors 3Alpha 0.01Partial Correlation 0.1Total Sample Size 1000Model Random X
Computed PowerPower0.541
Matome, kad statistinė galia sumažėjo.
Tarkime, kad analizuojamų poveikių skaičius yra 6. Tuomet turime tokį rezultatą:
Fixed Scenario ElementsMethod ExactNumber of Predictors in Full Model 7Number of Test Predictors 6Partial Correlation 0.1Total Sample Size 1000Model Random XAlpha 0.05
Computed PowerPower0.644
Matome, kad šiuo atvėju statistinė galia yra 0,644.
SAS paketas taip pat leidžia atlikti apriorinę statistinės galios analizę. Tarkime, kad modelio
statistinė galia yra 0,8. Raskime koks tokiu atvėju turi būti imties dydis. Sitaksė yra tokia:
Fixed Scenario ElementsMethod ExactNumber of Predictors in Full Model 7Number of Test Predictors 3Partial Correlation 0.1Nominal Power 0.8Model Random XAlpha 0.05
Computed N TotalActual Power N Total
0.800 1091
Matome, kad modelis yra statistiškai galingas, jeigu stebėjimų skaičius yra didesnis, negu 1091. Šį
skaičių galima patikslinti panaudojus opciją NFRACTIONAL. Gauname rezultatą:
Fixed Scenario ElementsMethod ExactNumber of Predictors in Full Model 7Number of Test Predictors 3Partial Correlation 0.1Nominal Power 0.8Model Random XAlpha 0.05
Computed Ceiling N TotalFractional N Total Actual Power Ceiling N Total
1090.033230 0.800 1091
Matome kad trupmeninė imties dydžio reikšmė 1090,033230 buvo suapvalinta į viršų.
Pažiurėkime, kaip pasikeis rezultatas kai modelis neturi susikirtimų. Turime rezultatą:
Fixed Scenario ElementsMethod ExactNumber of Predictors in Full Model 7Number of Test Predictors 3Partial Correlation 0.1Nominal Power 0.8Model Random XAlpha 0.05
Computed Ceiling N Total
10
Fractional N Total Actual Power Ceiling N Total1089.033230 0.800 1090
Matome, kad šiuo atvėju trupmeninė imties dydžio reikšmė buvo suapvalinta į apačią.
Kaip jau buvo minėta, SAS paketas leidžia vaizduoti rezultatus grafiškai. Pavaizduokime, kaip
statistinė galia priklauso nuo imties dydžio. Sintaksė yra tokia:
proc power plotonly;multreg test = type3nfractionalnfullpredictors = 7ntestpredictors = 3partialcorr = 0.1ntotal = .power = 0.8;plot y = power min = 0.5 max = 0.99; run;
Matome, kad rezultatai bus vaizduojami tik grafiniu pavidalu (plotonly opcija), y ašyje bus
vaizduojamos statistinės galios reikšmės rėžiuose nuo 0,5 iki 0,99. Gauname tokį rezultatą:
Dabar pavaizduokime kaip galia priklauso nuo imties dydžio, kai tiriamų poveikių skaičius kinta nuo
3 iki 5 (žingsnis – 1). Turime tokį rezultatą:
proc power plotonly;multreg test = type3nfractionalnfullpredictors = 7ntestpredictors = 3 to 5 by 1partialcorr = 0.1ntotal = .power = 0.8;plot y = power min = 0.5 max = 0.99; run;
11
Vaizduojant rezultatus grafiškai nesvarbu kokias reikšmes turi POWER ir NTOTAL kientamieji.
Svarbu tik kad bent vienas iš jų turėtų bet kokią prasmingą reikšmę (iš intervalo (0 ;1 ) galios atvėju arba
natūralusis skaičius imties dydžio atvėju).
Dispersinė analizė
Tarkime turime keturių fakultetų (informatikos, chemijos, ekonomikos ir socialinių mokslų)
matematikos testo rezultatus. Norime atsakyti į klausimą: „Ar matematikos testo rezultatų vidurkis
statistiškai skiriasi tarp fakultetų?“. Į šį klausimą galima atsakyti taikant dispersinę analizę. Tada nulinė
hipotezė yra:
H 0 : μ1=μ2=μ3=μ4
Alternatyvi hipotezė yra H a: ne visų grupių vidurkiai yra lygūs.
Kelkime kitokį klausimą: „Ar tiksliųjų mokslų (informatikos, chemijos ir ekonomikos) fakultetų
studentų matematikos testo rezultatų vidurkis statistiškai skiriasi nuo socialinių mokslų studentų?“. Tokiu
atvėju pagrindinė hipotezė yra:
H 0 :μ1+μ2+μ3
3=μ4
Alternatyvi hipotezė yra:
H a :μ1+μ2+μ3
3≠ μ4
Pastebėkime, kad nulinę hipotezę galime užrašyti ir kitaip:
12
H0 : μ4−13
μ1−13
μ2−13
μ3=0
Tokiu būdu gauname koeficientų vektorių (1 ;−13
;−13
;−13 ). Šį vektorių vadiname kontrastų
vektoriumi.
Bendruoju atvėju, tarkime turime n grupių. Tada kontrastų vektorių sudaro n narių ir jis parodo, kaip
yra susieti grupių vidurkiai. Kontrastų vektorių galima interpretuoti kaip tiriamų grupių vidurkių svorių
vektorių. Šio vektoriaus elementų suma turi būti lygi 0. Kontrastų vektoriaus ir vidurkių tiesinis darinys yra
vadinamas kontrastu.
Procedūros proc power sakinys ONEWAYANOVA < options > parodo, kad bus naudojama
dispersinė analizė. Šis sakinys turi tokias opcijas:
TEST – opcija leidžia pasirinkti koks kriterijus bus naudojamas. Opcija turi dvi reikšmes:
OVERALL_F (naudojamas Fišerio kriterijus) ir CONTRASTS (atliekama kontrastų analizė).
Pagal nutilėjimą opcijos reikšmė yra OVERALL_F.
ALPHA – reikšmingumo lygmuo. Reikšmė pagal nutilėjimą – 0,05.
GROUPMEANS – grupių vidurkių vektorius. Šis kintamasis taip pat parodo koks yra
bendras grupių skaičius.
STDDEV – paklaidų standartinis nuokrypis.
NFRACTIONAL – opcija nurodo, kad grupės arba imties dydis bus vaizduojamas
trupmeniniu pavidalu.
CONTRAST – kontrastų vektorius. Šis vektorius naudojamas tik jei yra pasirinkta kontrastų
analizė. Vektoriaus ilgis turi sutapti su vektoriaus GROUPMEANS ilgiu.
SIDES – nurodo alternatyviosios hipotezės tipą. Opcija turi 4 reikšmes: 1 (vienpusė), 2
(dvipusė), u (vienpusė ¿0), l (vienpusė ¿0). Reikšmė pagal nutilėjimą – 2. Opcija naudojama
tik jei yra pasirinkta kontrastų analizė.
NULLC – kontrasto reikšmė. Pagal nutilėjimą – 0. Kintamasis naudojamas tik jei yra
pasirinkta kontrastų analizė.
GROUPNS – grupių dydžių vektorius. Vektoriaus ilgis turi sutapti su vektoriaus
GROUPMEANS ilgiu.
GROUPWEIGTHS – grupių svorių vektorius. Šis vektorius parodo kaip imties elementai yra
pasiskirstę pagal grupes. Jeigu opcija NFRACTIONAL nebuvo įjungta, tai vektoriaus
elementai gali būti tik sveikieji skaičiai, be to bendrosios imties dydis yra proporcingas
vektoriaus elementų sumai. Vektoriaus ilgis turi sutapti su vektoriaus GROUPMEANS ilgiu.
13
NPERGROUP – kiekvienos grupės elementų kiekis. Kintamųjų GROUPWEIGTHS ir
NPERGROUP vienu metu naudoti negalima.
NTOTAL – visos imties dydis.
POWER – statistinė galia.
OUTPUTORDER – opcija nurodo kokia tvarka bus atspausdinami rezultatai. Ši opcija turi 3
reikšmes: INTERNAL (reikšmė pagal nutilėjimą), SYNTAX (spasdinimas pagal sintakse) ir
REVERSE (atvirkščias spausdinimas).
Štai paprastas procedūros proc power taikymo dispersinei analizei pavyzdis:
Fixed Scenario ElementsContrast Coefficients -0.5 1 -0.5Group Means 3 7 5Standard Deviation 8Nominal Power 0.8Number of Sides 2Null Contrast Value 0Alpha 0.05Computed Ceiling N Per Group
Fractional N Per Group Actual Power Ceiling N Per Group84.368796 0.803 85
Kaip ir tiesinės regresijos atvėju gautus rezultatus galima pavaizduoti grafiškai. Pirmiausia
pavaizduokime rezultatus grafiškai, kai atliekama Fišerio kriterijaus statistinės galios analizė.
Nubraižykime, kaip statistinė galia priklauso nuo visos imties dydžio kai standartinis nuokrypis kinta
nuo 8 iki 10 (žingsnis – 1). Sintaksė yra tokia:
proc power plotonly;onewayanova test=overall_fnfractionalgroupmeans = 3 | 7 | 5 stddev = 8 to 10 by 1npergroup = .power = 0.8;plot y = power min = 0.5 max = 0.99; run;
Gauname tokį rezultatą:
SAS paketas leidžia nubraižyti ne tik statistinės galios priklausomybę nuo visos imties dydžio, bet ir
nuo kiekvienos grupės dydžio. Nubraižykime šią priklausomybę kai standartinis nuokrypis kinta nuo 8 iki
10 (žingsnis – 1). Tada turime tokią sintaksę:
proc power plotonly;onewayanova test=overall_fnfractionalgroupmeans = 3 | 7 | 5
21
stddev = 8 to 10 by 1npergroup = .power = 0.8;plot y = power min = 0.5 max = 0.99; run;
Procedūros rezultatas yra toks:
Dabar pavaizduokime kontrastų analizės rezultatus grafiškai.
Nubraižykime statistinės galios priklausomybę nuo bendro imties dydžio kai kontrasto reikšmė kinta
nuo 6 iki 8 (žingsnis – 1). Sintaksė yra tokia:
proc power plotonly;onewayanova test = contrastnfractionalcontrast = (-0.5 1 -0.5)groupmeans = 3 | 7 | 5stddev = 8nullc = 6 to 8 by 1ntotal = .power = 0.8;plot y = power min = 0.5 max = 0.99;run;
Turime tokį rezultatą:
22
Nubraižykime statistinės galios priklausomybę nuo grupės dydžio kai kontrasto reikšmė keičiasi nuo
6 iki 8, o standartinis nuokrypis kinta nuo 8 iki 10 (žingsnis – 1). Naudosime vienpusę alternatyvią hipotezę.
Sintaksė yra tokia:
proc power plotonly;onewayanova test = contrastnfractionalsides = 1contrast = (-0.5 1 -0.5)groupmeans = 3 | 7 | 5stddev = 8 to 10 by 1nullc = 6 to 8 by 1npergroup = .power = 0.8;plot y = power min = 0.5 max = 0.99;run;
Šios procedūros rezultatas yra:
23
Išvados
Statistinės galios analizė yra svarbi bet kokios statistinės hipotezės tikrinimo dalis. Šios analizės
tikslas yra užtikrinti, kad antros rūšies klaidos tikimybė būtų kuo mažesnė. Iš kitos pusės statistinė galia
neturi būti artima vienetui, nes tokiu atvėju nulinė hipotezė beveik visada bus atmetama.
SAS paketas efektyviai atlieka statistinės galios analize. Šio paketo procedūra proc power yra
pakankamai lanksti, parametrų, leidžiančių efektyviai aprašyti duomenis, įvairovė yra pakankamai didelė.
Taip pat yra kėli naudingi kintamieji, kurie leidžia patikslinti procedūros rezultatus, pavyzdžiui
NFRACTIONAL.
Vartototojas gali lengvai pereiti nuo aposteriorinės statistinės galios analizės prie apriorinės ir
atvirkščiai. Vienas iš procedūros privalumų yra tai, kad tam yra reikalingi minimalūs programinio kodo
pataisymai.
Tiesinės regresijos atvėju vartotojas gali pasirinkti vieną iš tryjų skirtingų būdų analizuojamiems ir
neanalizuojamiems poveikiams aprašyti. Taip pat vienas iš privalumų yra tas, jog galima nurodyti, ar
modelis turi susikirtimų.
Dispersinės analizės atvėju atliekant kontrastų statistinės galios analizę vienas iš privalumų yra tas,
kad galima pakeisti alternatyviosios hipotezės tipą. Vienpusės hipotezės atvėju programa gali pati pasirinkti
tinkamą alternatyvią hipotezę, tačiau tai gali padaryti ir pats vartotojas. Atliekant apriorinę statistinės galios
analizę vartotojas taip pat turi teisę pasirinkti, ar bus nustatomas visos imties dydis, ar kiekvienos grupės
atskirai. Be to atliekant aposteriorinę analizę vartotojas gali aprašyti kaip visą imtį, taip ir kiekvieną grupę
atskirai. Grupėms aprašyti yra skirti net 3 skirtingi būdai.
Gautus rezultatus taip pat galima vaizduoti grafiškai, t.y galima nubraižyti statistinės galios
priklausomybę nuo esminio parametro – imties dydžio. Procedūra taip pat leidžia vaizduoti šią
priklausomybę kai vienas iš parametrų kinta tam tikru žingsniu.
24
LITERATŪRA
1. Park, Hun Myoung. 2008. Hypothesis Testing and Statistical Power of a Test. Working Paper. The
University Information Technology Services (UITS) Center for Statistical and Mathematical