tmemõõtmelised meetodid (multivariate methods) akomponentanalüüs (principal component analysis). Idee - endame hulk omavahel korreleeruvaid muutujaid vähem vu muutujatega, teeb elu lihtsamaks. Mispidi andmep lja venitatud, sinna telg. Component score – koordinaat sellel uuel teljel. Z 1 = a 1 X 1 + a 2 X 2 + a 3 X 3 + .... Uus muutuja vanade lineaarkombinatsioon. Ei testi midagi, eeltöö muudeks testideks.
Mitmemõõtmelised meetodid ( multivariate methods ) Peakomponentanalüüs ( principal component analysis ). Idee - asendame hulk omavahel korreleeruvaid muutujaid vähema arvu muutujatega, teeb elu lihtsamaks. Mispidi andmepilv välja venitatud, sinna telg. - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Mitmemõõtmelised meetodid (multivariate methods)
Peakomponentanalüüs (principal component analysis). Idee -asendame hulk omavahel korreleeruvaid muutujaid vähema arvu muutujatega, teeb elu lihtsamaks. Mispidi andmepilv välja venitatud, sinna telg.
Component score – koordinaat sellel uuel teljel.
Z1 = a1X1 + a2X2 + a3X3+ ....
Uus muutuja vanade lineaarkombinatsioon.
Ei testi midagi, eeltöö muudeks testideks.
Olukord, kus arvutame ühe peakomponendi.
Loodusest püütud liblika vanus- ei saa otse mõõta.
Sellega korreleerub usutavasti, kuid üksi ei iseloomusta:- kulunud olemine;- katki olemine;- kuupäev.
Alustame selle vaatamisest, kas on pidev või mitte.
Bonferroni korrektsioonimillal - kui ühe alltesti posit tulemus on piisav
järeldamaks laiema hüpoteesi posit tulemust -- kliimasoojenemise mõju taimede kasvukiirusele - 100 liiki.
5%-s sign tulemus juhuslikult ju -
sequential Bonferroni correction,- pane testid tabelisse ritta p-väärtuste kasvamise järjekorras;- esimese testi puhul võrdle saadud p’d väärtusega alfa/k, kus k on testide arv tabelis - kui p on väiksem, kuuluta test oluliseks
ja mine järgmise testi juurde - kui pole, siis kuuluta nii see esimene kui ka kõik järgmised testid mitteoluliseks;
- kui eelmine punkt ‘lubas’ jätkata, siis järgmise testi korral võrdle p’d väärtusega alfa/(k-1) - kui p on väiksem, kuuluta tulemus oluliseks ja mine edasi, kui pole, lõpeta;
- jne, st p’d tuleb võrrelda väärtusega alfa/(k+1-i).
Testi võimsuseks nimetatakse tõenäosust leida statistiliseltoluline seos antud suurusega valimi põhjal olukorras, kus tegelik seos üldkogumis on nii- või naasugune ja disper-sioonid on ka teada,
- kaks kasutusala- katse planeerimine - kui suur valim võtta?- järeldamaks midagi negatiivsest tulemusest.
Mittesign tulemus iseenesest pole kuigi tugev argument.
NB seose puudumist (või olemist täpselt null vms.) ei saa tõestada!
Saab tõestada, et pole suurem kui miski (biol relevantne väärtus),
-ei saanud seost statistiliselt oluliseks, kui aga seos oleksolnud tugevam kui ...., oleks selle oluliseks saamineolnud väga tõenäone, kuna me aga ei saanud, siis ju siis üldkogumis nii tugevat seost ei olnud;
ei kuulu standardprotseduuride hulka;
Lihtsam viis - parameetrite usalduspiirid.
Hüpoteesi testimine:
nullhüpotees ja sisukas hüpotees:
HO: - erinevust pole;
H1: - erinevus on;
Esimest tüüpi viga (type I error): kuulutame H1 õigeks, kui ta tegelikult pole;
Teist tüüpi viga (type II error): jääme HO juurde, kuigi tegelt on H1 õige.
Informatsioonikriteeriumid mudeli valimisel,
AIC – Akaike Information Criterion, IT-approach;
rakendub olukordades, kus uurime, millest kõigestmõõdetust sõltuv tunnus sõltub, kase kõrgus metsas....
mitte katses.
Saab võrrelda erinevaid mudeleid nende delta-i’de alusel,
parimaks kuulutada see, mille AIC on väikseim, - mitte ainult R-ruudu põhjal – keerulisemal alati suurem R-ruut, keerulisusest saab miinuseid; - mitte üksikute efektide p-väärtuste põhjal. .... teeme järeldused kas parimast mudelist või mitmest piisavalthästi sobivast mudelist – kaalud w. .
Bayesi statistika
“.... p on tõenäosus, et valimis nähtav seos on saadud juhuslikult”
“... tõenäosusega p üldkogumis seost ei ole.”
.... täringuga viskame kuue,.... tavatäringu korral tõenäosus 16,7%, see on p.
... pole ju tõenäosus, et täring on OK.
Aga kui teame, et pooltel juhtudel kasutab sohitäringut, saamejäreldada, et
85,7% vs 14,3%
Saame täringuga „kuue“; tõenäosus, et on sohitäring (või siisOK täring) sõltub - tõenäosusest saada „6“ õige täringuga; - tõenäosusest, et kasutatakse sohitäringut;
Samamoodi, tõenäosus, et üldkogumis r>0, sõltub kahest asjast; - tõenäosusest saada valimi r olukorras, kus r>0; - selliste üldkogumite esinemise tõenäosusest (sagedusest), kus r>0;
Kui teist asja teame, saame öelda, et tõenäosusega …. on üldkogum, kus r>0, nagu saime öelda, et tõenäosusega … on sohitäring.
Bayes’i statistika,
... meil on eelnev teave sellest, milline parameetriväärtus on kui tõenäone;