Gradientová analýza
Gradientová analýza
Gradient
• Gradient – zm ěna některého faktoru prost ředí
• Historické zdroje • Historické zdroje – Teorie vegeta čního kontinua (Gleason
1917, Ramenskij 1924) – Wisconsinská škola (50. léta): Curtis,
McIntosh, Bray – R. H. Whittaker (1956, 1960)
Tři hlavní problémy s daty o spole čenstvech
• „ zero truncation problem “• dáno výb ěrem měřítka „významu“ (performance) druhu = abundance• pokud druh chybí (tj. abundance = 0), chybí i infor mace o tom „jak moc nevhodné je prost ředí pro druh“
• odpov ědní k řivky druh ů jsou v ětšinou komplikované a vztahy mezi druhy jsou v ětšinou nelineární
• odpov ědní k řivky druh ů nejsou v ětšinou „ideální“, ale „zrnité“
• druhy jsou v ětšinou mén ě abundantní než je jejich potenciál v daném bodu gradientu prost ředí• důvodem je vliv dalších prom ěnných prost ředí, interakcí mezi druhy, náhody a limit ů šíření taxon ů
Ideální vs. reálné? Lineární a unimodání model
• hodn ě idealistické• vhodné pro velmi krátké gradienty
• chování druhu je popsatelné optimem (pr ůměr), standard. odchylkou a výškou vrcholu• vztah 2 druh ů s unimod. Gausovým modelem odpov ědi je nelineární a komplikovaný ( →→→→)
Parametry Gaussovy k řivky
t - tolerance rozdíl mezi optimem a polohou inflexního
u – druhové optimum (x-ová sou řadnice vrcholu k řivky
c maximální mohutnost populace
a polohou inflexního bodu Gaussovy k řivky
hodnoty faktoru prost ředí (gradient)
Odpov ědní k řivky druh ů A a B k faktoru prost ředí X
a očekávané abundance druh ů
Lineární model
Unimodální model
(Jongman et al. 1995, p. 94)
Přímá a nep římá gradientová analýza
� Přímá gradientová analýza – analyzuje zm ěny druhového složení podle známého a předem stanoveného jednoho nebo n ěkolika gradient ů prost ředí (ekoklina)– např. � nadmo řská výška � nadmo řská výška � rybník – litorál – rákosiny – louky � pH půdy
� Nepřímá gradientová analýza – analyzuje variabilitu druhového složení spole čenstva nezávisle na prost ředí– hledá sm ěr nejv ětší variability druhového složení (cenoklina) – komplexní gradient prost ředí
Gradienty prost ředí
� Přímé – bezprost ředně ovliv ňují růst rostlin � světlo � teplota � voda � živiny � živiny
� Nepřímé (zástupné) – snadno se m ěří a korelují s přímými faktory � nadmo řská výška � geologické podloží � typ p ůdy � sklon a orientace svahu � aj.
Přehled ordinace
Metody gradientové analýzy
� Regrese – regression (p římá GA) � Kalibrace – calibration (nep římá GA) � Ordinace – (indirect) ordination (nep římá GA) � Ordinace s omezením – constrained (direct)
ordination (p římá GA)ordination (p římá GA)
Přímá a nep římá gradientová analýza : přehled
Regrese� lineární model � yki = ak + bkx i + eki
– yki ... odpov ěď k-tého druhu na i-té lokalit ě – ak ... posun p římky (intercept) – bk ... sklon p římky (slope) – eki ... chyba – eki ... chyba
� unimodální model � proložení Gaussovské k řivky pomocí GLIM (= generalized linear modeling) � vážené pr ůměrování (weighted averaging) – uk = ΣΣΣΣi ( yki x i / yk . )
Regrese� mnohonásobná regrese (multiple regression) � regrese jedné závisle prom ěnné na n ěkolika nezávisle prom ěnných
� logistická regrese (logistic regression) � regrese s kategoriální závisle prom ěnnou; � odhaduje se pravd ěpodobnost, že p ři dané hodnot ě � odhaduje se pravd ěpodobnost, že p ři dané hodnot ě nezávisle prom ěnné dosáhne závisle prom ěnná hodnoty 1
Kalibrace� “obrácená regrese” � známe: druhové složení na lokalit ě i– vztah mezi druhy a faktory prost ředí � odhadujeme: faktory prost ředí na lokalit ě i
Kalibrace: lineární model
Druh 1
Druh 2
Druh 3
Faktor prostředí
Druh 3
Σk yki bkxi = –––––––––
Σk bk2
Kalibrace: unimodální model
Σk yki ukxi = –––––––––
Σk yki
� pracuje s druhovými optimy (= indika ční hodnoty) � zpravidla zanedbává rozdílné tolerance druh ů
� využívá tabelovaných hodnot optim druh ů � Ellenberg 1974, 1979, Ellenberg et al. 1992 (st řední Evropa)
• světlo (1–9) vlhkost (1–12) halofilnost (0-2) • teplota (1–9) reakce (1–9) • kontinentalita (1–9) živiny (1-9)
� Zólyomi et al. 1966, Borhidi, Soó, Simon (Ma ďarsko) � Landolt 1977 (Švýcarsko)� Jurko 1990 (Slovensko)
Ellenbergovy tabulky – ukázka tabulek + výpo čtu
(Lepš et Šmilauer, 2003, p. 33)
(Ellenberg et al. 1992, p. 100)
9
8
7
7
Ellenbergovy indika ční hodnoty: srovnání smrkových les ů tří poho ří
Reakce Vlhkost
Alps Carpathians BohemianMassif
Elle
nber
g re
actio
n va
lue
6
5
4
3
2
1
Elle
nber
g m
oist
ure
valu
e
6
5
4
Alps Carpathians BohemianMassif
Ellenbergovy indika ční hodnoty: projekce do sí ťových map rozší ření
(Chytrý et al. 1999, Preslia 71: 1–19)
Ellenbergovy indika ční hodnoty: změny druhového složení v čase
(Chytrý & Danihelka 1993, Folia Geobot. Phytotax. 28: 225–245)
Kritika Ellenbergovy metody
� ordinální stupnice neumož ňuje provád ět základní aritmetické výpo čty � hodnoty jsou tabelovány pro N ěmecko, zatímco v
jiných oblastech se druhy mohou chovat jinak � druhy často nejsou taxonomicky a ekologicky
homogenní a r ůzné ekotypy mohou mít r ůzná optima homogenní a r ůzné ekotypy mohou mít r ůzná optima � průměry jsou zatíženy chybou vyplývající z interakce
mezi faktory prost ředí� Faktor DUSÍK má charakter DOSTUPNOSTI ŽIVIN (tj.
spíše fosforu)� další čtení: Mucina (1985; Biologia), Jurko (1986;
Biologia), Klimeš (1987; Preslia)
Ordinace: 2 různé způsoby p řístupu
1. nalezni konfiguraci snímk ů v ordina čním prostoru tak, aby vzdálenost mezi vzorky v prostoru korespondovala nejlépe s nepodobností jejich druhového složení
............. multidimenzionální škálování(multidimensional scaling, MDS)(multidimensional scaling, MDS)
----- metrické MDS (Analýza hlavních kordinát, PCoA)
----- ne-metrické MDS2. nalezni „latentní prom ěnné“ (ordina ční osy), které
reprezentují nejlepší prediktory pro hodnoty všech d ruhů --> vyžaduje specifikaci modelu odpov ědi druhu k takové latentní prom ěnné
............ lineární a unimodální techniky ordina ce
Indirect gradient analysis• Distance-based approachesPolar ordination, PO (Bray-Curtis ordination) Principal Coordinates Analysis, PCoA (Metric multid imensional scaling) Nonmetric Multidimensional Scaling, NMDS• Eigenanalysis-based approaches
Linear modelPrincipal Components Analysis, PCA
Běžné ordina ční techniky (ter Braak and Prentice 1988)
Principal Components Analysis, PCAUnimodal model
Correspondence Analysis, CA (Reciprocal Averaging)Detrended Correspondence Analysis, DCADirect gradient analysis
Linear modelRedundancy Analysis, RDA
Unimodal modelCanonical Correspondence Analysis, CCADetrended Canonical Correspondence Analysis, DCCA
Základní p řehled hlavních ordina čních technik
Metoda Použitá míra nepodobnosti (vzdálenosti, distance)
Proměnné
PCA Euklideovská vzdálenost Kvantitativní data, lineární vztah (pozor na dvojité nuly)
PCoA, MDS jakákoliv Libovolné, i smíšené
NMDS jakákoliv Libovolné, i smíšené
CA Chi-square vzdálenost(distance)
Nezáporné, škálově homogenní kvantitativní nebo binární data (abundance nebo prezence-absence)
Faktorová analýza Euklideovská vzdálenost Kvantitativní data, lineární vztah (pozor na dvojité nuly)
(Legendre & Legendre 1998, p. 388)
Přehled základních typ ů ordinace v historickém kontextu
Ordinace� lokalizace vzork ů v mnohorozm ěrném prostoru,
jehož osami jsou druhy
Abundance druhu B
Ordinace� Ale také: • lokalizace druh ů v mnohorozm ěrném prostoru,
jehož osami jsou vzorky
Abundance ve vzorku 2
Ordina ční metody� zjednodušují mnohorozm ěrný prostor na 1–4
rozm ěry (princip není v redukci, ale v rotaci pohledu )� 1. osa zachycuje sm ěr nejv ětší variability v
hyperprostoru � 2. osa zachycuje další sm ěr nejv ětší variability
nezachycený 1. osou => nekoreluje s 1. osou (= nezachycený 1. osou => nekoreluje s 1. osou (= orthogonalita)� další osy zachycují další sm ěry nejv ětší variability,
nezachycené p ředchozími osami a nekorelují s předchozími osami� variabilita zachycená jednotlivými osami je vyjád řena
tzv. charakteristickými čísly (eigenvalues )
1.5
9
1011
1415
17
21
28
2930
Příklad ordina čního diagramu
-1.5 1.0
-1.0
1
2
34
56
7
8
9
12
1316
20
ordina ční osy
Centroid a inertia• Centroid je st řed objektu. Nap ř. bod daný sou řadnicemi -průměry dimenzí objektu (délka, výška, ší řka). Pokud se objekty liší v hustot ě, je nutné zahrnout tuto variabilitu do výpo čtu polohy centroidu.• Inertia je tendence objektu ležícího na daném míst ě v něm zůstat. Hodnota inertia objektu je p římo závislá na tom, jak je masa objektu rozložena kolem centroidu objektu. (= m ěřítko variability v mnohorozm ěrném prostoru)mnohorozm ěrném prostoru)
Iterativní algoritmus ordinace
� Krok 1: Každému vzorku je p řidělena ur čitá libovolná, ale navzájem nestejná hodnota (stanovištní skore) x i
� Krok 2: Pro každý druh se vypo čítá závislost na hodnotách stanovištních skore x i (lineární regresí druh ů na stanovištní skore pro lineární model nebo váženým pr ůměrováním pro unimodální model)váženým pr ůměrováním pro unimodální model)� Krok 3: Vypo čítají se nové hodnoty x i kalibrací s
užitím závislostí získaných v p ředešlém kroku � Krok 4: Odstran ění zmenšení m ěřítka � Krok 5: Pokud se hodnoty x i během cyklu nezm ěnily
(změna je menší než stanovená mez), cyklus se zastavuje, v opa čném p řípadě se vrací na krok 2
Analýza hlavních komponent, PCA Principal Components Analysis
� Hotelling (1933)� Lineární model (iterativní algoritmus využívá lineá rní
regrese)� Hlavní uplatn ění při analýze kvantitativních dat (faktory
prost ředí, taxonomická data) nebo relativn ě homogenních dat o druhovém složení (krátký, ostrý gradient)Dvě nejpoužívan ější varianty � Dvě nejpoužívan ější varianty � PCA na kovarian ční matici (species-centered PCA )
•x i’ = x i – ΣΣΣΣ x i / n
o nelze použít u prom ěnných m ěřených v r ůzných jednotkách, málo vhodná u druhových dat s procentic kýmipokryvnostmi
� PCA na korela ční matici (standardized PCA ) • x i – ΣΣΣΣ x i / n•x i’ = ––––––––––––• sx
o dává všem prom ěnným stejnou váhu
Jak funguje PCA?
centroid
Centrování +
Druhy X1, X2, X3Standardizované osy S1, S2, S3Ordina ční osy PCA 1, 2, 3
Centrování + (standardizace)
rotace
Ordina ční diagram PCA: druhy Škálování druhových skóre I
1.0
Agr sto
Alo gen
Cir arv
Ele pal
Ely rep
Jun art
Jun buf
Lol per
Poa pra
Poa tri
Ran fla
Poa ann
Co značí délky vektor ů druh ů:
1. standardizace – skóre děleno standardní odchylkou � výsledkem je korela ční biplot a délka vektoru je m ěřítkem fitu
-1.0 1.0
-0.8
Ach mil
Air pra
Ant odo
Ele pal
Emp nig
Hyp radPla lan
Pot palRum ace
Sal repTri pra
Tri rep
Cal cusRan acr
vektoru je m ěřítkem fitu (R, mnohonásobný korela ční koeficient ) příslušného druhu v ordina čním diagramu.
2. bez dělení standardní odchylkou: délka odráží změny v abundanci druhu (dlouhý vektor = velká změna abundance, často dominantní druhy).
Ordina ční diagram PCA: druhy Škálování druhových skóre II
1.0
cynopoly
hypnando
hypncupr
paralong
Příklad : stejný datový soubor
Vlevo : druhová skóre transformována (d ěleno standardní odchylkou)
-1.0 0.6
-0.2
grimhartleucglau
lophbarb
plagchasplagtsucschistsp
-4.0 2.0
-0.5
2.5
cynopoly
grimhart
hypnando
hypncupr
isotalopleucglaulophbarb
paralong
plagchasplagtsuc
rhizpuncschistsp
Dole vpravo : druhová skore bez transformace
Ordina ční diagram PCA: snímky
1.0
2
3
4
8
9 12
13
16
-1.0 1.5
-0.8
1
5
6
710
11
14 15
17
20
21
28
29
30
PCA: Biplot a „biplot rule“
1.0
Agr sto
Alo gen
Bel perBro hor
Che albCir arv
Ely repJun buf
Lol per
Poa pra
Poa tri
Sag pro2
3
4
8
912
13
Dvě možnosti prezentace:o distance biplot: o vzdálenosti mezi objekty jsou
aproximací jejich Euklideovských vzdáleností
o délka vektoru druhu indikuje jeho příspěvek k tomuto prostoru
o úhly mezi vektory druh ů nemají významo vhodné pro reprezentaci vztah ů mezi
plochami
-1.0 1.0
-1.0
Ach mil
Air praAnt odo
Ele pal
Emp nig
Hyp rad
Jun art
Leo autPla lan
Pot pal
Ran flaRum ace
Sal rep
Tri pra
Tri rep
Vic latBra rut
Cal cus
1
5
6
710
11
1415
16
1718
19
20
plochami
o correlation biplot: o vzdálenosti mezi objekty nejsou
aproximací jejich Euklideovských vzdáleností
o délka vektoru druhu je aproximací jeho standardní odchylky (variability)
o úhel mezi vektory druh ů reprezentuje jejich korelaci
o vhodné pro reprezentaci vztah ů mezi druhy
Kolik os (komponent)?
o V případě standardizované PCA je možné interpretovat osy s
vlastními čísly > 1
o Pro nestandardizovanou PCA je možné interpretovat os y s vlastními
čísly > průměrné vlastní číslo všech osčísly > průměrné vlastní číslo všech os
o Empiricky: interpretovatelných je n ěkolik první os, v ětšinou 2-4
o pomocné kritérium: Broken stick model (Frontier 197 6)
Výhody a nevýhody PCA
+ -
Lze použít i na ordinální či binární data (ale ne smíšená)
Není vhodná pro vícestavové kvalitativní znaky
PCA je dostatečně robustní Efekt podkovy u binárních PCA je dostatečně robustní (nevyžaduje data s mnohorozměrně normálním rozdělením)
Efekt podkovy u binárních dat
Počet znaků by měl být menší než počet vzorků (nevýhoda u RAPD či AFLP)
Analýza hlavních koordinát (PCoA)• umožňuje pracovat se všemi typy prom ěnných a s r ůznými mírami nepodobnosti (distancí), i neeukleidovskými →→→→ může být s nimi problém � některé hodnoty vlastních čísel mohou být negativní(řešení: transformace hodnot koef. disimilarity nebo ignorace negat. hodnot)
• obecn ější forma PCA – zobrazí pouze Euklideovskou část matice vzdáleností = Euklideovskou část matice vzdáleností = nejlepší možná Euklideovská aproximace originální matice nepodobností !!!
• pracujeme pouze s n ěkolika prvními osami• nevýhoda: nespecifikuje vztah druh ů k ordina čním osám – volná volba modelu (lineární, unimodální...) + sou řadnice objekt ů na ordina čním grafu nejsou lineárn ě závislé na hodnotách p ůvodních znaků Duchoslav et al., Ann. Bot. 2010
Nemetrické mnohonásobné škálování (NMDS)
• cílem analýzy není uchování vzdáleností mezi objekt y, ale pořadí vzdáleností mezi objekty, v n ěkolika málo dimenzích (tj. podobn ější objekty jsou si blíže a mén ě podobné dále v ordina čním prostoru)• umožňuje pracovat se všemi typy prom ěnných a s r ůznými mírami nepodobnosti (distancí), i neeukleidovskými, symetrickými a nesymetrickýmisymetrickými a nesymetrickými• vhodná též pro situace, kdy chyb ějí některé párové hodnoty distancíStress: míra kvality ordinace, míra shody založená na diferencích mezi fitovanou vzdáleností modelem (d ij) a predikovanou (d ij) regresní funkcí mezi empirickou vzdáleností a fitovanou vzdáleností• rozsah 0-1, čím nižší, tím lepší, do 0.15 akceptovatelné, dle hodnoty volíme po čet os
Doporučené čtení: Fasham M. (1977), Ecology 58: 551-561.
NMDS - příkladMatice nepodobností mezi sporty
Koresponden ční analýza (CA) I. Correspondence Analysis
� Unimodální model (iterativní algoritmus využívá váž eného průměrování)� Hlavní uplatn ění při analýze dat o druhovém složení, která
obsahují hodn ě nulových hodnot � Vážené průměrování zahrnuje standardizaci jak snímky tak
druhy � jakékoliv dva vzorky s identickými relativními abundancemi (vz. A: 1,2,3; vz. B: 10,20,30) budou považovány za abundancemi budou považovány za
identické !!!
(Lepš et Šmilauer 2003, p. 36)
Odstran ění zmenšení měřítka:
xresc=(x-xmin )/(xmax-xmin )*délka
Koresponden ční analýza (CA) II.
• Eigenvalue m ěří zároveň míru separace nik mezi druhy podél osy • Pokud chci v ědět % vysv ětlené variability dané osy, musím d ělit hodnotu eigenvalue celkovou variabilitou (total inertia )• problém: efekt podkovy ( arch effect ) a zkreslení ekologické vzdálenosti
Detrendovaná koresponden ční analýza, DCA, Detrended Correspondence Analysis
� Odstra ňuje z CA „arch effect“ a zkreslené ekologické vzdálenosti (v CA jsou snímky se stejnými rozdíly v druhovém složení umíst ěny blíže k sob ě na koncích než uprost řed ordina ční osy) � Detrendování (detrending) – odstra ňuje “arch effect”
po segmentech (by segments) � po segmentech (by segments) � přes mnoho členy (by polynomials) – máš-li v DCA analýze kovariáty či faktory prost ředí, použij tento typ !!!
� Přeškálování (rescaling) – srovnává ekologické vzdálen osti � po p řeškálování je pr ůměrná rychlost objevování se a mizení druh ů na gradientech p řibližn ě konstantní � SD units (jednotky sm ěrodatné odchylky) � na vzdálenosti 1 SDU se vym ění 1/2 druh ů ve snímcích � na vzdálenosti 4 SDU se úpln ě změní druhové složení snímk ů
Arch efekt v CA
Detrendování po segmentech
Hill & Gauch 1980, Vegetatio 42: 47–58
PřeškálováníOriginální gradient
1. Osa CA
1. Osa DCA
1.5
9
1011
1415
17
21
28
2930
Ordina ční diagram DCA: vzorky
-1.5 1.0
-1.0
1
2
34
56
7
8
9
12
1316
20
1.5
Ach mil
Air pra
Ant odo
Emp nigHyp rad
Jun art
Leo autPla lan
Pot pal
Ran flaRum ace
Sal rep
Tri praTri rep
Vic lat
Bra rut
Cal cus
Hip rha
Ran acr
Ordina ční diagram DCA: druhy
-1.5 1.5
-1.5
Agr sto
Alo gen
Bel perBro hor
Che alb
Cir arv
Ele pal
Ely rep
Jun bufLol per Poa pra
Poa tri
Sag proPoa ann
DCA: joint diagram a „centroid principe“4
Agr sto
Ant odo
Jun artJun buf
Leo aut
Ran fla
Sag pro
Sal rep
Tri rep
Bra rut
1214 15
16
17
18
19
20
Dvě možnosti škálování:
1. distance rule: pro dlouhé strmé gradienty (nad 2
-1 5
-1
Ach mil
Agr sto
Alo gen
Bel per
Bro hor
Ele pal
Ely rep
Lol per
Pla lan
Poa pra
Poa tri
Rum ace
Tri rep
1
2
3
45
6
7
8
9
10
1112
13
16 gradienty (nad 2 SD; Hillovo škálování )
2. biplot rule: pro krátké gradienty (do 2 SD)
Příklady použití ordina čních technik
DCA: ordina ční diagram s klasifikací + Interpretace os pomocí korela ční analýzy I
(Hanáková et Duchoslav, Čas. Slez. Mus. 2002, p. 246-247)
DCA: ordina ční diagram s klasifikací + Interpretace os pomocí korela ční analýzy II
Vztah pr ůměrné indika ční hodnoty pro dusík a pozicí fyt.snímk ů na 1. fyt.snímk ů na 1. ordina ční ose DCA
(viz p ředchozí snímek prezentace)
(Hanáková et Duchoslav, Čas. Slez. Mus. 2002, p. 246-247)
Ordina ční diagram s klasifikací
Chytrý & Sádlo 1997, Ann. Bot. 55: 105–126
Ordina ční diagram s klasifikací
Chytrý & Sádlo 1997, Ann. Bot. 55: 105–126
Změny vegetace hodnocené ordinací
Chytrý & Danihelka 1993, Folia Geobot. Phytotax. 28: 225–245
Změny vegetace hodnocené ordinací
Chytrý & Danihelka 1993, Folia Geobot. Phytotax. 28: 225–245
Změny vegetace hodnocené ordinací
Chytrý & Danihelka 1993, Folia Geobot. Phytotax. 28: 225–245
Přímá ordinace (ordinace s omezením) Direct (constrained) ordination
� metoda p římé gradientové analýzy � spojení ordinace a lineární regrese � nehledá se cenoklina, ale popisuje se zm ěna
druhového složení v závislosti na m ěřených prom ěnných prost ředí prom ěnných prost ředí � není vhodná, když nemáme žádnou p ředstavu o
vztahu mezi prom ěnnými prost ředí a druhovým složením spole čenstva: tehdy použijeme spíš nepřímou ordinaci � je vhodná pro hodnocení ekologických experiment ů
nebo pozorování, kdy nás zajímá vztah druhového složení k p ředem vybraným prom ěnným
Iterativní algoritmus p římé ordinace
� Do iterativního algoritmu nep římé ordinace se p řidá:
Krok 3a: Výpo čet mnohonásobné lineární regrese získaných stanovištních skóre na m ěřených prom ěnných prost ředí a nahrazení p ůvodních stanovištních skóre hodnotami aproximovanými stanovištních skóre hodnotami aproximovanými touto regresí
Metody p římé ordinace
� Analýza redundance (redundancy analysis, RDA) –metoda pro lineární model odvozená od PCA� Kanonická koresponden ční analýza (canonical
correspondence analysis, CCA) – metoda pro unimodální model odvozená od CA� Detrendovaná kanonická koresponden ční analýza
(detrended canonical correspondence analysis, DCCA) – metoda pro unimodální model odvozená od DCA
Jak pracuje CCA …nejlepší gradient ...
1.0
A1
5 14
15
20
21
1.0
Pot pal
Ran acr
Metody p římé ordinace (RDA) Dune Meadow Data
-0.6 1.2
-0.6
Moisture
1
2 3
4
6
7
89
10
1112
1316
17
21
28
29
30
-0.6 1.2
-0.6
Agr sto
Alo gen
Bel per
Che alb
Cir arv
Ele pal
Ely rep
Emp nigHyp radJun art
Jun buf
Leo autPoa tri
Ran fla
Rum ace
Sal rep
Tri pra Tri rep
Vic latBra rut
Cal cus
Hip rhaPoa ann
Axes 1 2 3 4 Tota l variance Eigenvalues : .227 .028 .212 .115 1.000
Metody p římé ordinace (RDA) Dune Meadow Data
Eigenvalues : .227 .028 .212 .115 1.000 Species-environment correlations : .902 .597 .000 .000 Cumulative percentage variance
of species data: 22.7 25.5 46.7 58.2 of species-environment relation: 89.0 100.0 .0 .0
Sum of all unconstrained eigenvalues 1.000 Sum of all canonical eigenvalues .255
2.5 Pot pal
Tri praRan acr
2.5
A1514
15
20
Metody p římé ordinace (CCA) Dune Meadow Data
-1.0 2.0
-1.5
Agr sto
Air pra
Alo genAnt odo
Bel per
Che alb
Cir arv
Ele pal
Emp nig
Hyp rad
Jun artJun buf
Leo aut
Pla lan
Poa tri
Ran fla
Rum ace
Sag pro
Sal rep
Tri pra
Tri repBra rut
Cal cus
Hip rha
Poa ann
-1.0 2.0
-1.5
A1
Moisture1
2
34
5
6
7
89
10
1112
13
1617
20
21
28
2930
Axes 1 2 3 4 Tot al inertia Eigenvalues: .414 .111 .401 .277 2.130
Metody p římé ordinace (CCA) Dune Meadow Data
Eigenvalues: .414 .111 .401 .277 2.130 Species-environment correlations: .921 .728 .000 .000 Cumulative percentage variance
of species data: 19.4 24.6 43.4 56.5 of species-environment relation: 78.9 100.0 .0 .0
Sum of all unconstrained eigenvalues 2.130 Sum of all canonical eigenvalues .524
2.0
Ach mil
Air pra
Ant odo
Ele pal
Emp nig
Hyp rad
Jun artPla lan
Pot pal
Sal rep
Vic lat Cal cus
Hip rha
Ran acr
2.0
Hayfield5
910
14
17
21
28
29 30
Metody p římé ordinace (CCA) Dune Meadow Data s nominálními prom ěnnými prost ředí
-1.0 2.5
-1.5
Ach mil
Agr sto
Alo gen
Bel perBro hor
Che albCir arv
Ele pal
Jun buf
Leo aut
Lol per
Poa pra
Poa tri
Pot pal
Ran flaRum ace
Sag pro
Tri pra
Tri repBra rut
Poa ann
Ran acr
-1.0 2.5
-1.5
A1 Moisture
Haypastu
Pasture
12
34
6
7 8
11
12 13
14
15
1620
Axes 1 2 3 4 Total inertia
Metody p římé ordinace (CCA) Dune Meadow Data s nominálními prom ěnnými prost ředí
Axes 1 2 3 4 Total inertia Eigenvalues: .426 .152 .144 .043 2.130 Species-environment correlations: .929 .684 .793 .776 Cumulative percentage variance
of species data: 20.0 27.1 33.9 35.9 of species-environment relation: 55.7 75.5 94.3 100.0
Sum of all unconstrained eigenvalues 2.130 Sum of all canonical eigenvalues .765
Kódování prom ěnných prost ředí v přímé ordinaci Dune Meadow Data
ENVIRONMENTAL DATA IN FULL FORMAT - DUNE MEADOW DATA (I5,F5.0,1X,2F3.0,3X,3F2.0,3X,4F2.0) 10
1 2.8 1 4 0 1 0 1 0 0 0 2 3.5 1 2 0 1 0 0 1 0 0 3 4.3 2 4 0 1 0 1 0 0 0 4 4.2 2 4 0 1 0 1 0 0 0 5 6.3 1 2 1 0 0 0 0 1 0 6 4.3 1 2 0 1 0 0 0 1 0 7 2.8 1 3 0 0 1 0 0 1 0 8 4.2 5 3 0 0 1 0 0 1 0 9 3.7 4 1 1 0 0 0 0 1 0 9 3.7 4 1 1 0 0 0 0 1 0 10 3.3 2 1 1 0 0 0 1 0 0 11 3.5 1 1 0 0 1 0 1 0 0 12 5.8 4 2 0 1 0 1 0 0 0 13 6.0 5 3 0 1 0 1 0 0 0 14 9.3 5 0 0 0 1 0 0 0 1 15 11.5 5 0 0 1 0 0 0 0 1 16 5.7 5 3 0 0 1 1 0 0 0 17 4.0 2 0 1 0 0 0 0 0 1 28 4.6 1 0 1 0 0 0 0 0 1 29 3.7 5 0 1 0 0 0 0 0 1 30 3.5 5 0 1 0 0 0 0 0 1 0 0.0 0 0 0 0 0 0 0 0 0
A1 MoistureManure HayfieldHaypastuPasture SF BF HF NM Sample 1Sample 2Sample 3Sample 4Sample 5Sample 6Sample 7Sample 8Sample 9Sample10 Sample11Sample12Sample13Sample14Sample15Sample16Sample17 SupplSAM Duplic17 Sample18Sample19Sample20
Parciální ordinace
� Odstra ňuje část variability vysv ětlené “nezajímavými” prom ěnnými (nap ř. vliv bloku p ři hodnocení dat z pokus ů) � Následn ě se přímými nebo nep římými ordina čním
metodami analyzuje zbytková variabilita Technicky: � Technicky: �“nezajímavé” prom ěnné se definují jako kovariáty (koprom ěnné, covariables) � provede se regrese prom ěnných prost ředí na kovariátách a rezidua této regrese zaujmou místo p ůvodních prom ěnných prost ředí
� ordina ční osy parciální ordinace reprezentují čistý vliv prom ěnných prost ředí, s vylou čením vlivu kovariát
Parciální CCA Dune Meadow Data kovariáta: vlhkost, prom ěnná prost ředí: hloubka p ůdního horizontu A1
4
1721 29
4
Air praEmp nig
Hyp rad
-2 3
-1
A11
2
34
5
6
789
1011
1213
14 15
16
20
28
30
-2 3
-1
Agr stoAlo gen
Ant odo
Bel perBro hor
Che alb
Ele pal
Pla lan
Poa pra
Pot palRum ace
Sag pro
Sal rep
Tri praVic lat
Bra rut
Cal cus
Hip rha
Poa ann
Ran acr
Axes 1 2 3 4 Total inertia
Parciální CCA Dune Meadow Data kovariáta: vlhkost, prom ěnná prost ředí: hloubka p ůdního horizontu A1
Axes 1 2 3 4 Total inertia Eigenvalues: .125 .401 .277 .199 2.130 Species-environment correlations: .725 .000 .000 .000 Cumulative percentage variance
of species data: 7.2 30.4 46.4 57.9 of species-environment relation: 100.0 .0 .0 .0
Sum of all unconstrained eigenvalues 1.730 Sum of all canonical eigenvalues .125
Case study: Jak ovlivňuje podíl smrku ve stromovém patru druhové složení podrostu?
•Model: •Partial RDA •Envir. variable•Picea coverCovariables
•Results:•Ax 1 eigenvalue 0.022 •Ax 1 significance 0.001 •% variance of species data 2.7 •% variance of spec.-env. relation 100 Covariables
•Altitude •Slope aspect •Slope inclination •Mineral soil depth •Free carbonate depth •Mottling depth •Tree layer cover
•% variance of spec.-env. relation 100
• •RDA Ax 1 scores: •positive negative •Dicranum scopa 0.36 Fagus sylvatica -0.36 •Plagiomn affine 0.32 Sanicula europa -0.29 •Plagiothe curvif 0.29 Carex flacca -0.27 •Pleuroziu schre 0.28 Cicerbita alpina -0.22
•Hypnum cupres 0.26 Veronica monta -0.21
Ewald 2000, Appl. Veg. Sci. 3: 123-138
Rozklad variance (variance partitioning) Borcard et al. 1992, Ecology 73: 1045–1055
� odděluje varianci vysv ětlenou dv ěma skupinami prom ěnných � např. � abiotické vs. biotické faktory � prom ěnné prost ředí vs. čas � edafické vs. klimatické prom ěnné � vlastnosti p řírodního prost ředí vs. zásahy člověka
Rozklad variance (variance partitioning) Borcard et al. 1992, Ecology 73: 1045–1055
celková variabilita
sdílenávariabilitazbytková variabilita
variabilita vysv ětlená druhouskupinou prom ěnných
variabilita vysv ětlenáprvní skupinou prom ěnných
Rozklad variance (variance partitioning) Borcard et al. 1992, Ecology 73: 1045–1055
celková variabilita druhových dat (total inertia) minus sou čet zelené, fialové a červené variability
variabilitavysv ětlená
1. skupinouprom ěnných
v analýze, kde2. skupina prom ěnných
tvo ří kovariáty
variabilitavysv ětlená
2. skupinouprom ěnných
v analýze, kde1. skupina
prom ěnnýchtvo ří kovariáty
variabilita vysv ětlená jednou
ze dvou skupin prom ěnných v analýze
bez kovariát minus variabilita vysv ětlená
v analýzes kovariátami
Permuta ční test (Monte Carlo test)
� Testuje, zda vybraná prom ěnná prost ředí má signifikantní vliv na druhové složení � Nulová hypotéza: variabilita druhového složení je
nezávislá na testované prom ěnné prost ředí � Spočítá se statistika F (pom ěr variability vysv ětlené
regresí a reziduální variability) pro reálná data
� Envir. variable 3 5 3 8 4 6–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––Species 1 0 2 0 1 1 2Species 2 1 1 1 0 3 3Species 3 2 2 1 0 0 1
regresí a reziduální variability) pro reálná data � Permutace: náhodn ě se přeskupí hodnoty
prom ěnné prost ředí mezi jednotlivými snímky a spočítá se F
•
Permuta ční test (Monte Carlo test)
� Permutace se provede mnohokrát a vždy se zaznamená hodnota F � Udělá se rozložení t ěchto hodnot a porovná se
s hodnotou F pro skute čná (nepermutovaná) data
•rozložení hodnot F
F
rozložení hodnot Fpro všechny permutace
F původních dat ⇒ vliv prom ěnné je nesignifikantní
F původních dat ⇒ vliv prom ěnné je signifikantní
Permuta ční test (Monte Carlo test)
� 19 permutací – test pro 5% hladinu významnosti (P<0.05)� 99 permutací – test pro 1% hladinu významnosti
(P<0.01)� 999 permutací – test pro 0.1% hladinu významnosti
(P<0.001) (P<0.001)
Permuta ční test (Monte Carlo test)
� test první kanonické osy – nap ř. zajímá-li nás vliv jedné kvantitativní prom ěnné � test všech kanonických os – nap ř. zajímá-li nás
vliv nominální prom ěnné s n ěkolika kategoriemi � test částečného (podmín ěného; partial,
conditional ) vlivu prom ěnné, jsou -li v modelu conditional ) vlivu prom ěnné, jsou -li v modelu zahrnuty už jiné prom ěnné
Permuta ční test (Monte Carlo test)
� unrestricted permutations – data nemají žádnou vnit řní strukturu, zápisy jsou nezávislé � unrestricted permutation within blocks defined by
covariables –2 3 7 6 5 3 | 7 2 3 4 5 3 8
–5 7 2 3 3 6 | 4 3 3 5 8 2 7
–6 3 2 5 3 7 | 3 4 2 8 5 7 3
� restricted permutations for time series or line transects – pro potenciáln ě autokorelovaná data
–2 3 7 6 5 3 7 2 3 4 5 3 8
–5 3 8||2 3 7 6 5 3 7 2 3 4
–3 7 2 3 4 5 3 8||2 3 7 6 5
� split-plot design – složit ější uspo řádání: “split plots” jsou v řazeny do “whole plots”
Příklady použití p římé ordinace pro studium vztah ů mezi druhovým
složením a vn ějšími faktory
Změna vegetace v čase: opakování starých fytocenologických snímk ů
� testovaná prom ěnná: čas (nominální prom ěnná: staré zápisy – 0, nové zápisy – 1) � kovariáty: jakékoliv zm ěřené prom ěnné, které
mohou ovliv ňovat variabilitu vegetace v prostorunapř. např. � nomináln ě kódovaná lokalita � nomináln ě kódované geologické podloží � topografický index xericity � nadmo řská výška
� randomizace: unrestricted permutations ;jsou-li nominální kovariáty, unrestricted permutations within blocks defined by covariables
Změna vegetace v čase: trvalé plochy
� testovaná prom ěnná: čas � jeden záznam každoro čně nebo studium zm ěn během
jediné sezóny � kovariáty: jakékoliv zm ěřené prom ěnné, které mohou ovliv ňovat variabilitu vegetace v prostoru � randomizace: restricted permutations for time series or line � randomizace: restricted permutations for time series or line transects within blocks defined by covariables (jednotlivé plochy jsou definovány jako kovariáty);jsou-li další nominální kovariáty, použije se split-plot design
� víceleté studium s n ěkolika záznamy v každém roce � kovariáty: tytéž, navíc nominální prom ěnné kódující sezónu (např. květen, červenec, zá ří) nebo čas od začátku roku � randomizace: je-li sezóna kódována nominálními prom ěnnými, použije se split-plot design , kde plochy jsou randomizovány odd ěleně ve whole plots a sezóny ve split-plots
Permutace dat z trvalých plochV každém obdélníku restricted permutations for time series
1997 1998 1999 2000
Plot 3
1997 1998 1999 2000
Plot 1
1997 1998 1999 2000
Plot 2
Whole plots
2000 2001
1997 1998 1999 2000 2001
2000 2001
1997 1998 1999 2000 2001
2000 2001
1997 1998 1999 2000 2001
Analýza dat z transekt ů
� testovaná prom ěnná: nap ř. pH, hloubka p ůdy, pokryvnost stromového patra apod., zaznamenávané na transektu � randomizace: restricted permutation for time
series or line transectsprochází -li transekt výrazným gradientem, lze � prochází -li transekt výrazným gradientem, lze tento gradient odstranit použitím po řadí plochy na transektu jako kovariáty � spole čná analýza dat z více transekt ů � variabilita mezi transekty se m ůže odstranit definováním transekt ů jako série nominálních kovariát � randomizace restricted permutation for time series or line transects, blocks defined by covariables
Analýza terénních manipulativních pokus ů
� testovaná prom ěnná: interakce času a pokusného zásahu (nap ř. kosení a kontrola) � kovariáty: nomináln ě kódované plochy (zahrnují i
pokusné zásahy), čas � randomizace: split-plot design : � whole plots (zásahy): freely exchangeable � whole plots (zásahy): freely exchangeable � split plots (stejné plochy v r ůzných časech: restricted
permutation for time series or line transects
� je-li víc typ ů pokusných zásah ů, testují se � spole čně, každý jako interakce s časem v jednom modelu, čas jako kovariáta � každý zvláš ť jako interakce s časem, p řičemž vždy interakce ostatních zásah ů s časem jsou kovariáty a čas je také kovariáta
Kódování orientace svahu
•PDSI modely –(potential direct solar irradiation)
•Heat index (Parker 1988) –HI = cos (orientace – 225o) * tg sklonu
360o = 0o
90o270o
45o315o
–HI = cos (orientace – 225 ) * tg sklonu
�Topografický index relativní vlhkosti (Parker 1982) � vrchol h řebene = 0, dno údolí = 20 � JJZ = 0, SSV = 20 � sklon > 30 o = 0, 0o = 10 � konvexní = 0, konkávní = 10
90o
180o
270o
135o225o