Universidade Técnica de Lisboa Instituto Superior de Agronomia MODELAÇÃO DA DISTRIBUIÇÃO E DA ABUNDÂNCIA LOCAL DO CÁGADO-MEDITERRÂNICO (Mauremys leprosa) E DO CÁGADO-DE-CARAPAÇA-ESTRIADA (Emys orbicularis) EM PORTUGAL Pedro Segurado Orientador: Doutor José Miguel Oliveira Cardoso Pereira Júri Presidente: Doutor António Manuel Dorotêa Fabião Professor Associado do Instituto Superior de Agronomia da Universidade Técnica de Lisboa Vogais: Doutor José Miguel Oliveira Cardoso Pereira Professor Associado do Instituto Superior de Agronomia da Universidade Técnica de Lisboa Doutor Jorge Manuel Mestre Marques Palmeirim Professor Auxiliar da Faculdade de Ciências da Universidade de Lisboa Mestrado em Gestão de Recursos Naturais Lisboa 2000 Universidade Técnica de Lisboa
122
Embed
Universidade Técnica de Lisboa - cea.uevora.pt · Só para acabar e agora numa ordem totalmente aleatória e sem qualquer tipo de preferência ... (competição, predação e mutualismo),
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Universidade Técnica de Lisboa
Instituto Superior de Agronomia
MODELAÇÃO DA DISTRIBUIÇÃO E DA ABUNDÂNCIA LOCAL DO CÁGADO-MEDITERRÂNICO (Mauremys leprosa) E DO CÁGADO-DE-CARAPAÇA-ESTRIADA (Emys orbicularis)
EM PORTUGAL
Pedro Segurado
Orientador: Doutor José Miguel Oliveira Cardoso Pereira
Júri
Presidente: Doutor António Manuel Dorotêa Fabião
Professor Associado do Instituto Superior de Agronomia da Universidade Técnica de Lisboa
Vogais: Doutor José Miguel Oliveira Cardoso Pereira
Professor Associado do Instituto Superior de Agronomia da Universidade Técnica de Lisboa Doutor Jorge Manuel Mestre Marques Palmeirim
Professor Auxiliar da Faculdade de Ciências da Universidade de Lisboa
Mestrado em Gestão de Recursos Naturais
Lisboa 2000
Universidade Técnica de Lisboa
Instituto Superior de Agronomia
MODELAÇÃO DA DISTRIBUIÇÃO E DA ABUNDÂNCIA LOCAL DO CÁGADO-MEDITERRÂNICO (Mauremys leprosa) E DO
CÁGADO-DE-CARAPAÇA-ESTRIADA (Emys orbicularis) EM PORTUGAL.
Pedro Segurado
Orientador: Doutor José Miguel Oliveira Cardoso Pereira
Júri
Presidente: Doutor António Manuel Dorotêa Fabião
Professor Associado do Instituto Superior de Agronomia da Universidade Técnica de Lisboa
Vogais: Doutor José Miguel Oliveira Cardoso Pereira
Professor Associado do Instituto Superior de Agronomia da Universidade Técnica de Lisboa Doutor Jorge Manuel Mestre Marques Palmeirim
Professor Auxiliar da Faculdade de Ciências da Universidade de Lisboa
Dissertação apresentada neste Instituto
para efeitos de obtenção de grau de Mestre
Mestrado em Gestão de Recursos Naturais
Lisboa 2000
RESUMO
Dados sobre a presença/ausência de Mauremys leprosa e de Emys orbicularis em
quadrículas UTM decaquilométricas foram utilizados para ajustar modelos preditivos da
distribuição. Recorreu-se a duas técnicas estatísticas: modelos baseados em árvores de
classificação e modelos de regressão logística multivariada. As variáveis preditoras foram
obtidas a partir do Atlas do Ambiente de Portugal e incluíam variáveis macroclimáticas,
geomorfológicas, ecológicas e de cobertura do solo. Por forma a maximizar o leque de
escolhas na selecção do modelo mais adequado, foram ajustados um grande número de
modelos estatisticamente válidos. Os mapas preditivos da distribuição foram obtidos
através de um Sistema de Informação Geográfica. Como complemento a esta informação
estudou-se a influência de variáveis locais na presença ou abundância das espécies.
Ambos os métodos e as variáveis ambientais disponíveis revelaram-se
razoavelmente eficazes na modelação da distribuição, tendo-se obtido precisões totais de
classificação na ordem dos 80% para M. leprosa e de 84% para E. orbicularis. As
variáveis mais importantes na distribuição das espécies foram sobretudo de natureza
climática, como a radiação solar, humidade, escoamento, evapotranspiração, precipitação
e regiões ecológicas. Os resultados apontam para fortes indícios de regressão de E.
orbicularis em Portugal. Os mapas resultantes serão úteis para seleccionar áreas
4.1 Interpretação ecológica dos modelos................................................................ 95
4.2 Avaliação e interpretação dos modelos segundo a sua representação geográfica...............................................................................................................
99
4.3 Influência de varáveis locais............................................................................. 102
Os resultados dos testes não paramétricos (Tabelas 3.3 A a 3.3 B) mostram que o
comportamento das covariáveis quantitativas é semelhante nas quatro matrizes de dados
criadas. Efectivamente, para todas as covariáveis, o teste de ANOVA de Kruskal-Wallis e
o teste da mediana, separadamente para presenças e ausências, não revelaram diferenças
significativas (p<0.05) entre as quatro matrizes. Em todas as matrizes e para a maioria das
variáveis, a classe ausência apresenta maior dispersão dos dados.
Os resultados do teste de Kolmogorov-Smirnov de duas amostras revelam que em
todas as matrizes as distribuições das covariáveis em cada classe da variável resposta não
são significativamente diferentes (p<0.05) para três variáveis: ALT, SOLO e GEAD. Na
primeira (Tabela 3.2 A) e na quarta matriz (Tabela 3.2 D), não ocorrem igualmente
diferenças significativas entre as duas classes, respectivamente para a variável TEMP e
HUMI. Nas matrizes restantes os valores de confiança para estas duas variáveis são sempre
mais baixos do que para as variáveis restantes.
Os testes de Mann-Whitney (Tabelas 3.3 A a 3.3 B) mostram que os locais de
presença de Mle apresentam valores médios significativamente mais elevados (p<0.05)
para as variáveis TEMP, INSO, RADS, ECOL e ESTE, e valores médios
significativamente mais baixos para as variáveis PREC, HUM, ESCO, EVAP, DPOP e
NORT. Os gráficos da figura 3.2 mostram como variam a média e a dispersão dos dados
com a ausência e a presença da espécie para estas variáveis. O mesmo teste mostra a
ausência de diferenças significativas entre os valores médios para as variáveis ALT, SOLO
e GEAD. Para a quarta matriz, tal como o resultado do teste anterior, não se observam
igualmente diferenças significativas entre as médias para a variável HUMI.
33
3. Resultados
Tabela 3.3(A) Matriz 4 - Resultados do teste de Kolmogorov-Smirnov (K.-S.) e do teste de Mann-Whitney (M.-W.) para cada variável quantitativa (SD - desvio padrão).
Tabela 3.3(B) Matriz 2 - Resultados do teste de Kolmogorov-Smirnov (K.-S.) e do teste de Mann-Whitney (M.-W.) para cada variável quantitativa (s - desvio padrão).
Variáveis Ausências Presenças K. - S. M. - W. Média s Média s p p TEMP 4.121 0.957 4.841 0.618 < .001 <.0001 PREC 6.448 2.521 3.866 1.312 < .001 <.0001 HUMI 3.776 0.992 3.220 1.043 < .01 <.005 ESCO 7.310 2.458 4.512 1.493 < .001 <.0001 EVAP 5.379 1.167 3.878 1.047 < .001 <.0001 INSO 8.500 2.401 11.085 1.642 < .001 <.0001 RADS 2.741 1.278 4.220 1.111 < .001 <.0001 ALTI 3.741 2.014 3.463 1.390 n.s. n.s. ECOL 4.603 1.521 5.707 1.094 < .001 <.0001 SOLO 3.690 1.143 3.671 1.166 n.s. n.s. GEAD 4.862 2.180 4.890 1.778 n.s. n.s. DPOP 3.259 1.888 1.939 1.200 < .001 <.0001 Nº da coluna 12.534 6.009 15.756 5.355 < .001 <.0005 Nº da linha 36.810 14.462 22.707 13.394 < .001 <.0001
34
3. Resultados
Tabela 3.3(C) Matriz 3 - Resultados do teste de Kolmogorov-Smirnov (K.-S.) e do teste de Mann-Whitney (M.-W.) para cada variável quantitativa (s - desvio padrão).
Variáveis Ausências Presenças K. - S. M. - W. Média s Média s p p TEMP 4.143 0.948 4.616 0.800 < .05 <.001 PREC 6.349 2.424 4.267 1.662 < .001 <.0001 HUMI 3.730 1.096 3.140 0.922 < .01 <.0005 ESCO 7.016 2.530 4.895 1.645 < .001 <.0001 EVAP 5.286 1.263 3.988 1.046 < .001 <.0001 INSO 8.571 2.388 10.686 1.917 < .001 <.0001 RADS 2.762 1.292 4.233 1.081 < .001 <.0001 ALTI 3.778 1.879 3.779 1.418 n.s. n.s. ECOL 4.841 1.526 5.593 1.131 < .001 <.0005 SOLO 3.619 1.224 3.721 1.059 n.s. n.s. GEAD 4.778 2.210 5.116 1.711 n.s. n.s. DPOP 3.127 1.718 1.895 1.302 < .001 <.0001 Nº da coluna 12.651 5.982 16.581 5.012 < .001 <.0001 Nº da linha 37.000 14.507 24.558 14.914 < .001 <.0001
Tabela 3.3(D) Matriz 4 - Resultados do teste de Kolmogorov-Smirnov (K.-S.) e do teste de Mann-Whitney (M.-W.) para cada variável quantitativa (s - desvio padrão).
Figura 3.2 Média Desvio padrão (SD) das variáveis quantitativas (testes de Mann-Whitney e Kolmogorov-Smirnov significativos p<0.05) para cada classe. (continua na página seguinte).
±
36
3. Resultados
Figura 3.2 (continuação) Média Desvio padrão (SD) das variáveis quantitativas (testes de Mann-Whitney e Kolmogorov-Smirnov significativos p<0.05) para cada classe.
±
Os resultados dos testes de χ2 (Tabela 3.4) mostram algumas diferenças no
comportamento das covariáveis qualitativas nas quatro amostras. Verifica-se, porém, para
todas as matrizes, uma preferência significativa (p<0.01) de Mle por locais com a presença
de AZIN, CUARV, CABAV e com a ausência de RESI e PINH. Nos gráficos da figura 3.3
estão representados os histogramas por classe de presença/ausência da espécie destas
variáveis.
Tabela 3.4 Resultados dos testes de χ2 (1 grau de liberdade) para cada variável qualitativa (os valores a bold são significativos a 99% de confiança; (+) - influência positiva sobre a presença, (-) - influência negativa sobre a presença). Variáveis Matriz 1 Matriz 2 Matriz 3 Matriz 4 X2 p X2 p X2 p X2 p FOLH 0.97 0.325 0.02 0.885 0.000 0.998 0.180 0.669 RESI 27.56 0.000 (-) 29.88 0.000 (-) 22.05 0.000 (-) 28.95 0.000 (-) OLIV 2.43 0 .119 4.30 0 .038 6.29 0.012 4.64 0.031 SOBR 2.25 0.134 1.03 0 .310 0.38 0.537 0.52 0.472 AZIN 22.52 0.000 (+) 18.22 0.000 (+) 14.73 0.000 (+) 12.72 0.000 (+) CARV 2.38 0.123 0.12 0.724 2.33 0.127 6.90 0.009 (-) PINH 6.93 0.009 (-) 20.96 0.000 (-) 9.15 0.003 (-) 9.07 0.003 (-) EUCT 8.53 0.004 (-) 0.05 0.825 1.85 0.173 6.93 0.009 (-) CAST 0.72 0.398 1.65 0.200 0.69 0.406 0.01 0.921 FIGU 0.19 0.660 5.14 0.023 4.58 0.032 5.53 0.019
Foram ajustados um total de 41 modelos, incluindo modelos com as variáveis de
localização (ESTE e NORT), com transformações das variáveis e com interacções entre
variáveis. Na tabela 3.6 estão representadas as frequências e a relação das covariáveis com
a variável resposta ajustada, incluindo as transformações e interacções, nos 41 modelos de
regressão. As variáveis mais importantes na ocorrência da espécie, tendo em conta a sua
frequência nos modelos e a sua frequência em relação às matrizes de treino que deram
origem aos modelos, são o escoamento (ESCO), a humidade relativa do ar (HUMI), a
radiação solar (RADS) e as variáveis de localização (ESTE e NORT). Entre as variáveis
qualitativas, a variável olival (OLIV) é a que surge com maior frequência. A interacção
entre covariáveis mais frequente nos modelos é a interacção entre a humidade e o
escoamento (HUMI*ESCO).
Tabela 3.6 Frequência total, frequência em relação às quatro matrizes de treino e relação das covariáveis com a variável resposta ajustada. Covariável Frequência Nº de matrizes Relação positiva Relação negativa ESCO 18 4 HUM 16 3 RADS 10 4 ESTE 10 4 NORT 10 4 SOLO 9 2 EVAP 7 3 PREC 6 2 INSO 3 2 GEAD 3 1 ECOL 2 1 DPOP 2 1 OLIV 12 2 EUC 9 1
Na Figura 3.4 apresentam-se as percentagens de classificações correctas para um ponto de
corte de 0.6 e as estatísticas Deviance, para a amostra de treino e para a amostra de
validação. Os valores de deviance e da estatística de Pearson da amostra de treino, bem
como o valor tabelado de χ2, apresentam-se na tabela 3.8.
O modelo 6 apresenta as precisões de classificação mais elevadas e possui o menor
valor de D para a amostra de treino (Figura 3.4). Porém, a estatística de Pearson não é
significativa (X2 < χ2 0.001; Tabela 3.10) e apresenta os maiores valores médios de D e de
X2 (ponderados pelos respectivos graus de liberdade) para as amostras de validação (Figura
3.6).
O modelo 10 apresenta simultaneamente os valores médios mais baixos de D para
as amostras de validação (Figura 3.4). No entanto, apresenta menores valores médios de
precisão de classificação da amostra de validação, as precisões de classificação da amostra
de treino são também relativamente baixas e o respectivo valor de D ponderado pelos graus
de liberdade é o mais elevado (Figura 3.4).
Os modelos 2, 3 e 4 são os que apresentam valores mais equilibrados entre as
amostras de treino e de validação, no que se refere aos valores de precisão da classificação
e aos valores de D (Figura 3.4). Estes três modelos incluem, no entanto, as variáveis
espaciais (ESTE e NORT), possuindo assim um significado biológico pouco preciso.
O modelo 1, para além de possuir as melhores precisões de classificação das
amostras de validação, apresenta simultaneamente valores de precisão da classificação da
amostra de treino comparativamente elevados e valores de D da amostra de treino e das
42
3. Resultados
amostras de validação relativamente baixos (Figura 3.4). Por outro lado, inclui as cinco
variáveis macroclimáticas que surgiram com maior frequência nos modelos. Tendo em
consideração estas características e ao facto de possuir um razoável significado biológico,
considerou-se este modelo como o mais adequado para a modelação da distribuição da
espécie.
���������������������������������������������
���������������������������������������������
���������������������������������������������
����������������������������������������
����������������������������������������
����������������������������������������
����������������������������������������
����������������������������������������
�����������������������������������
�����������������������������������74
76
78
80
82
84
86
1 2 3 4 5 6 7 8 9 10
Modelos
% d
e cl
assi
ficaç
ões
corr
ecta
s
0.0
0.2
0.4
0.6
0.8
1.0
1.2
D /
g. l.
���������������������� T.c. - validação
T.c. - treino
D/g.l. - validação
D/g.l. - treino
Figura 3.4 Comparação entre as taxas de classificação (colunas) e os valores ponderados de deviance (linhas) da amostra de treino e das amostras de validação.
Tabela 3.8 Valores das estatísticas deviance e de Pearson (g. l. - graus de liberdade) Modelo g. l. χ2
Na tabela 3.9 apresenta-se o sumário do modelo seleccionado, incluindo os resultados dos
testes t aos parâmetros, os valores do odds ratio e os respectivos intervalos de confiança.
Tabela 3.9 Sumário dos resultados do ajustamento do modelo 1 (LRS - teste G ou estatística do quociente de verosimilhanças; s -desvio padrão). Deviance = 121.613 (para 151 g.l.) LRS = 92.037
Termos Coeficientes s t p Odds ratio Intervalo de confiança β0 3.627 1.708 2.123 0.034 37.600 1.316 - 1075
Na figura 3.5 encontra-se representada a relação de cada variável com a respectiva
variável ajustada, após o ajustamento de um modelo aditivo generalizado com as variáveis
do modelo 1. Verifica-se que para a variável PREC ocorre um desvio considerável à
linearidade. Entre as classes 2 e 7 a relação é linear positiva e a partir da classe 7 a relação
torna-se linear negativa. Para as restantes variáveis os desvios são claramente menores. Os
testes parciais incluídos no sumário do modelo aditivo generalizado (Tabela 3.10) indicam-
nos a importância da suavização para cada termo no modelo. Os testes são significativos
apenas para as variáveis PREC e ESCO.
Tendo em conta este diagnóstico, efectuaram-se transformações das duas variáveis
de modo a tornar a relação o mais linear possível, e testou-se o seu efeito no modelo
logístico. Para a variável PREC consideraram-se apenas as classes de 1 a 7, uma vez que a
maioria das observações se situavam neste intervalo, tendo as observações incluídas nas
classes de 8 a 13 sido afectas à classe 7. Para a variável ESCO efectuou-se uma
transformação polinomial. A transformação da variável PREC originou um decréscimo de
cerca de três valores no deviance da amostra de treino e um ligeiro aumento no valor
médio da taxa de classificação das amostras de validação. A transformação da variável
ESCO apenas teve um efeito significativo no modelo logístico quando se ajustou um
polinómio de quarto grau. Uma vez que tal procedimento aumentava demasiado a
complexidade do modelo optou-se por não transformar esta variável.
44
3. Resultados
Figura 3.5 Relação entre cada variável incluída no modelo 1 e a respectiva variável ajustada com um modelo aditivo generalizado.
Tabela 3.10 - Sumário do modelo aditivo generalizado (s - função de suavização, g. l. - graus de liberdade, LRS - teste G ou estatística de quociente de verosimilhanças). Deviance = 105.954 (para 136.535 g. l.) LRS = 107.696
Na tabela 3.11 apresenta-se o sumário do resultado do ajustamento do modelo 1 após o re-
escalonamento da variável. Relativamente ao modelo anterior verifica-se um decréscimo
de 3.22 valores do deviance e um acréscimo de 0.391 no valor de t para a variável PREC.
Os coeficientes e os respectivos valores de t das restantes variáveis mantiveram-se
idênticos.
45
3. Resultados
Neste modelo, as covariáveis PREC e RADS possuem um efeito positivo na
ocorrência da espécie, ao passo que a (HUMI)2, o ESCO e a (EVAP)2 possuem um efeito
negativo. A PREC e o ESCO são as que provocam uma maior variação na probabilidade de
ocorrência por cada mudança unitária.
Tabela 3.11 Sumário dos resultados do ajustamento do modelo 1 após o re-escalonamento da variável PREC (LRS - teste G ou estatística do quociente de verosimilhanças; s -desvio padrão). Deviance = 118.392 (para 151 g.l.) LRS = 95.259
Termos Coeficientes s t p Odds ratio Intervalo de confiança
Na figura 3.6 está representada a variação das precisões de classificação da amostra
completa para pontos de corte sucessivamente maiores. Tal como para os modelos
anteriores, o ponto de corte de 0.6 é o que origina um maior equilíbrio entre as
percentagens de quadrículas de presença e de ausência bem classificadas.
Na tabela 3.12 apresentam-se as medidas de qualidade de ajustamento do modelo
para o melhor ponto de corte incluindo as precisões do produtor e do utilizador e os valores
absolutos e ponderados de deviance e de X 2 de Pearson. O modelo classifica
correctamente 80.72% do total de quadrículas amostradas e as quadrículas afectas a uma
das classes estão em média 80.22% bem classificadas. Quer em termos da precisão do
produtor quer em termos da precisão do utilizador o modelo classifica consideravelmente
melhor as quadrículas de presença.
46
3. Resultados
A
0102030405060708090
100
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Pontos de corte
Prec
isão
do
prod
utor
(%)
Total
Presenças
Ausências
B
40
50
60
70
80
90
100
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Pontos de corte
Prec
isão
do
utili
zado
r (%
)
Média
Presenças
Ausências
Figura 3.6 Precisão de classificação da amostra completa para cada ponto de corte. A - precisão do produtor; B - precisão do utilizador
Tabela 3.12 Medidas de qualidade de ajustamento do modelo para um ponto de corte de 0.6 (Aus. - ausências; Pres. - presenças; * - valores médios). Modelo Precisão do produtor Precisão do utilizador D D/g.l. X2 X2/g.l.
Figura 3.8 Comparação entre as precisões de classificação (colunas) e os valores ponderados de deviance (linhas) da amostra de treino e das amostras de validação.
49
3. Resultados
Na figura 3.9 está representada a árvore de classificação referente ao modelo 3 com
a estrutura interna apresentada na tabela 3.14. Segundo o modelo a espécie ocorre para
valores de RADS superiores ou iguais a 3 (145Kcal/km2) e valores de PREC inferiores ou
iguais a 3 (500-600 mm), ou para valores de PREC superiores ou iguais a 4 (600-700mm)
e valores de HUMI inferiores ou iguais a 3 (70-75%) e classes de ECOL superiores ou
iguais a 4 (desde a região Sub-Montano - Termo-Subatlântico à região
Psamo/Eolo/Aluvio/Halo - Mediterrânico).
Note-se que o espaçamento entre os níveis é proporcional à importância do
respectivo nó. Assim, a separação com maior significado é introduzida pela variável
RADS, dando origem ao primeiro nó terminal (“ausência”) com uma probabilidade de erro
apenas de 0.09 (Tabela 3.14). Os nós terminais com maior probabilidade de erro são o
terceiro e o quinto, respectivamente com probabilidades de 0.333 e 0.307, correspondendo
ambos à resposta “ausência”. Os dois nós terminais correspondentes à resposta “presença”
possuem probabilidades de erro relativamente baixas (0.105 e 0.152). Deste modo, as
maiores probabilidades de erro deste modelo resultam da classificação como “ausência”
das quadrículas em que a radiação solar toma valores superiores à classe 2.
Figura 3.9 Árvore de classificação seleccionada.
50
3. Resultados
Tabela 3.14 Estrutura interna da árvore de classificação seleccionada (n - nº de observações; D - deviance; * - nós terminais; os números dos nós correspondem aos números da árvore original, antes de se proceder à sua simplificação). Nó n D Resposta Probabilidades
Na tabela 3.15 apresentam-se as medidas de qualidade de ajustamento do modelo
incluindo as precisões do produtor e do utilizador, os valores de deviance e respectivos
valores ponderados pelos graus de liberdade. O modelo classifica correctamente 80.72%
do total de quadrículas amostradas e as quadrículas afectas a uma das classes estão em
média 80.29% bem classificadas. Em termos da precisão do produtor o modelo classifica
ligeiramente melhor as quadrículas de ausência. A precisão do utilizador é no entanto
consideravelmente superior para as quadrículas de presença.
Tabela 3.15 Medidas de qualidade de ajustamento do modelo para um ponto de corte de 0.5 (Aus. - ausências; Pres. - presenças; * - valores médios). Modelo Precisão do produtor Precisão do utilizador D D/g.l.
Aus. Pres. Total Aus. Pres. Média
Amostra de treino
82.54 84.88 83.89 73.31 87.01 80.31 124.65 0.87
Amostra de validação
81.41 78.26 79.58 72.57 85.33 78.95 136.84 0.97
Amostra completa
81.78 79.94 80.72 74.81 85.76 80.29 535.16 0.92
51
3. Resultados
3.2.1.4 Comparação e integração dos dois modelos
Os melhores modelos de distribuição de Mle segundo os duas abordagens estatísticas
adoptadas - árvores de classificação e regressão logística - apresentam em comum a
inclusão de três covariáveis: RADS, PREC e HUM. Para além destas covariáveis a árvore
de classificação inclui ainda a covariável ECOL e o modelo de regressão logística inclui
ainda as covariáveis ESCO e EVAP.
Na figura 3.10 apresentam-se os valores de precisão do ponto de vista do produtor
para a amostra original, segundo os dois modelos de distribuição. A precisão total é igual
para os dois modelos (80.72%), mas no modelo de regressão logística, ao contrário do que
sucede para a árvore de classificação, as quadrículas de presença são melhor classificadas
do que as de ausência. Por outro lado, para a árvore de classificação verifica-se um maior
equilíbrio entre as quadrículas de presença e de ausência bem classsificadas.
Figura 3.11 Precisão de classificação do ponto de vista do utilizador das quadrículas de ausência e de presença da amostra original e respectiva média.
Cerca de 83% das quadrículas da amostra original foram classificadas de igual
modo pela árvore de classificação e pelo modelo de regressão logística. Por outro lado,
cerca de 72% das quadrículas foram simultaneamente bem classificadas pelos dois
modelos.
Na tabela 3.16 apresentam-se as precisões de classificação da amostra completa
considerando apenas as quadrículas de consenso entre os dois modelos. Há um aumento de
confiança de 6.32% do ponto de vista do produtor em relação aos modelos considerados
separadamente avaliados com a amostra completa de quadrículas. Do ponto de vista do
utilizador esse aumento é de 6.30% em relação à precisão da árvore de classificação e de
6.37% em relação ao modelo de regressão logística. Por outro lado, existe para estas
quadrículas um maior equilíbrio entre as precisões de classificação para ausências e
presenças. Os valores de deviance ponderados pelos graus de liberdade para estas
quadrículas apresentam um decréscimo de 0.18 e de 0.16 valores em relação aos valores
obtidos, respectivamente, com a árvore de classificação e com o modelo de regressão
logística para o total de quadrículas amostradas.
53
3. Resultados
Tabela 3.16 Medidas de qualidade de ajustamento do modelo para as quadrículas de consenso entre os modelos.
Precisões de classificação Deviance dos resíduos
Precisão do produtor Precisão do utilizador Árvore de classificação Regressão logística
Aus. Pres. Total Aus. Pres. Média D D/g.l. D D/g.l.
Figura 3.12 Média Desvio padrão (SD) das variáveis quantitativas (testes de Mann-Whitney e Kolmogorov-Smirnov significativos p<0.05) para cada classe. (continua na página seguinte).
±
55
3. Resultados
Figura 3.12 (continuação) Média Desvio padrão (SD) das variáveis quantitativas (testes de Mann-Whitney e Kolmogorov-Smirnov significativos p<0.05) para cada classe.
±
Quanto às variáveis quantitativas verifica-se uma preferência significativa (p<0.01)
de Eor por locais com a presença de AZIN, CUARV, CABAV e com a ausência de RESI e
56
3. Resultados
CARBS (Tabela 18). Nos gráficos da figura 3.13 estão representados os histogramas por
classe de presença/ausência da espécie destas variáveis.
Tabela 3.18 Resultados dos testes de χ2 (1 grau de liberdade) para cada variável qualitativa (os valores a bold são significativos a 99% de confiança; (+) - influência positiva sobre a presença, (-) - influência negativa sobre a presença). Variáveis X2 (1 g.l.) p FOLH 0.390 0.532 RESI 20.850 <0.000 (-) OLIV 0.240 0.626 SOBR 0.390 0.532 AZIN 15.350 <0.000 (+) CARV 1.300 0.253 PINH 3.980 0.046 EUCT 4.150 0.042 CAST 0.03 0.852 FIGU 2.380 0.123 MEDR 1.280 0 .257 ALFA 3.280 0.070 AMEN 3.280 0.070 CUARV 7.800 0.005 (+) CARBS 7.170 0.007 (-) CARBR 0.150 0.698 CAVAB 0.630 0.426 CABAV 15.170 <0.000 (+) INCT 2.650 0.103 SAL 1.620 0.203
Figura 3.13 Histogramas das variáveis qualitativas (testes χ2 significativos a p<0.05) para cada classe.
57
3. Resultados
Figura 3.13 (continuação) Histogramas das variáveis qualitativas (testes χ2 significativos a p<0.05) para cada classe.
3.2.2.2 Regressão logística
Analise univariada
Na tabela 3.19 apresentam-se os resultados da regressão logística univariada para cada
covariável. O padrão encontrado é idêntico ao obtido com os testes não paramétricos,
excepto para seis variáveis qualitativas em que a convergência do algoritmo não foi
possível. Todas as variáveis quantitativas e nove variáveis qualitativas foram seleccionadas
à partida para o ajustamento dos modelos multivariados (Tabela 3.19).
58
3. Resultados
Tabela 3.19 Resultado da regressão logística univariada (LRS - decréscimo do Deviance em relação ao modelo nulo, p(G) - resultado do teste G, p(t) - resultado do teste de Wald; * - não se alcançou a convergência no cálculo dos parâmetros; valores a bold - variáveis excluídas da análise multivariada). Variáveis LRS p(G) p(t) TEMP 11.55 p<.001 0.005 PREC 29.30 p<.001 p<.001 HUMI 0.38 0.539 0.540 ESCO 31.58 p<.001 p<.001 EVAP 27.82 p<.001 p<.001 INSO 30.64 p<.001 p<.001 RADS 39.87 p<.001 p<.001 ALTI 3.84 0.050 0.062 ECOL 21.51 p<.001 p<.001 SOLO 2.54 0.111 0.115 GEAD 1.74 0.187 0.196 DPOP 13.60 p<.001 0.001 ESTE 4.96 0.026 0.031 NORT 31.287 p<.001 p<.001 FOLH 0.38 0.536 0.534 RESI 23.26 p<.001 p<.001 OLIV 0.24 0.628 0.626 SOBR 0.40 0.527 0.534 AZIN 15.36 p<.001 p<.001 CARV 1.46 0.227 0.278 PINH 4.34 0.037 0.056 EUCT 4.27 0.039 0.045 CAST 0.04 0.851 0.853 FIGU 2.33 0.127 0.161 MEDR * ALFA * AMEN * CUARV 7.97 0.005 0.006 CARBS * CARBR 0.15 0.699 0.698 CAVAB * CABAV 15.14 p<.001 p<.001 INCT 2.76 0.097 0.108 SAL *
Analise multivariada
Para esta espécie foram obtidos nove modelos possíveis, incluindo modelos com as
variáveis de localização (ESTE e NORT), com transformações das variáveis e com
interacções entre variáveis. Para todos os modelos o melhor ponto de corte foi de 0.4. Na
tabela 3.20 apresentam-se as frequências com que surgem as covariáveis nos modelos e a
respectiva relação com os valores esperados da variável resposta. O termo mais frequente
nos modelos é a transformação logarítmica de ALTI, que aparece em cinco dos nove
modelos, tendo uma relação negativa com a probabilidade de presença da espécie. As
covariáveis não transformadas mais frequentes são a RADS e o NORT, surgindo em três
59
3. Resultados
dos nove modelos, estando relacionadas, respectivamente, positiva e negativamente com a
probabilidade de ocorrência da espécie.
Tabela 3.20 Frequência nos modelos e relação das covariáveis com o valor esperado da variável resposta. Covariável Frequência Relação positiva Relação negativa RADS 3 NORT 3 ESTE 2 ESCO 1 ALTI 1 RESI 1 AZI 1 Ln(ALT) 5 (RADS)2 1 Ln(ESTE) 1 ESCO*RADS 1 RADS*Ln(ALTI) 1 NORT*ESTE 1
Os modelos obtidos encontram-se esquematizados na tabela 3.21, por ordem
decrescente dos erros de classificação da amostra de validação. Todos os modelos são
muito simples, com duas a três covariáveis. As variáveis espaciais surgem em quatro dos
nove modelos.
Tabela 3.21 Os nove modelos por ordem decrescente dos erros de classificação da amostra de validação. Modelo Fórmula
1 β0 +β1(RADS) + β2(ESCO)
2 β0 + β1(NORT) + β2(AZI)
3 β0 + β1(ESTE) + β2(NORT*ESTE) + β3(ln(ALTI))
4 β0 + β1(RADS) + β2(ESCO*RADS)
5 β0 + β1(ln(ESTE)) + β2(NORT) + β3(ln(ALTI))
6 β0 + β1(ESTE) + β2(NORT) + β3(ALTI)
7 β0 + β1(RADS)2 + β2(ln(ALTI)) + β3(RES)
8 β0 + β1(RADS*ln(ALTI)) + β2(ln(ALTI)) + β3(RES)
9 β0 + β1(RADS) + β2(Ln(ALTI)
60
3. Resultados
Selecção do modelo final
Quanto às medidas de qualidade de ajustamento do modelo (Figura 3.14), os modelos 3 e 5
são os que apresentam globalmente os melhores valores, quer para a amostra de treino,
quer para a amostra de validação. Porém, estes modelos contêm as variáveis espaciais, não
tendo por isso sido seleccionados. O modelo 1 é o que melhor classifica a amostra de
validação, mas, no entanto, o resultado do teste X 2 de Pearson para este modelo não
resultou significativo (X2 < χ20.001; Tabela 3.22). O modelo 4, resultante da substituição no
modelo 1 da variável ESCO pela interacção ESCO*RADS, é um modelo com medidas
equilibradas entre as duas amostras e possui um significado biológico razoável, pelo que
foi escolhido como o mais adequado à modelação da distribuição desta espécie.
Figura 3.14 Comparação entre as taxas de classificação (colunas) e os valores ponderados de deviance (linhas) da amostra de treino e da amostra de validação.
61
3. Resultados
Tabela 3.22 Valores das estatísticas deviance e de Pearson (g. l. - graus de liberdade) Modelo g. l. χ2
Na tabela 3.23 apresentam-se os resultados do ajustamento do modelo 4, incluindo os
valores dos coeficientes, testes t, os odds ratio e os respectivos intervalos de confiança.
Neste modelo, a covariável RADS apresenta um efeito positivo muito acentuado na
ocorrência da espécie, ao passo que a interacção entre ESCO e RADS possui um efeito
negativo e pouco acentuado.
Tabela 3.23 Sumário dos resultados do ajustamento do modelo 4 (LRS - teste G ou estatística do quociente de verosimilhanças; s -desvio padrão). Deviance = 56.021 (para 75 g.l.) LRS = 47.919
Termos Coeficientes s t p Odds ratio Intervalo de confiança β0 -3.597 1.189 -3.025 0.003 0.027 0.003 - 0.282 RADS 1.880 0.427 4.407 <0.001 6.554 2.837 - 15.140 ESCO*RADS -0.213 0.084 -2.555 0.011 0.808 0.686 - 0.952
Na figura 3.15 está representada a variação das precisões de classificação correctas
da amostra completa, para pontos de corte sucessivamente mais elevados. O ponto de corte
de 0.4 é o que produz um maior equilíbrio entre as percentagens de quadrículas de
presença e de ausência bem classificadas.
62
3. Resultados
A
0102030405060708090
100
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Pontos de corte
Prec
isão
do
prod
utor
(%)
Total
Presenças
Ausências
B
40
50
60
70
80
90
100
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Pontos de corte
Prec
isão
do
utili
zado
r (%
)
Média
Presenças
Ausências
Figura 3.15 Precisão de classificação da amostra completa para cada ponto de corte. A - precisão do produtor; B - precisão do utilizador
Na tabela 3.24 apresentam-se os valores de precisão do produtor e do utilizador e os
valores absolutos e ponderados de deviance para a amostra de treino, para a de validação e
para a amostra completa. A árvore classifica correctamente 84.48 % do total de quadrículas
e em média 84.04% das quadrículas afectas a uma das classes estão bem classificadas. Em
termos de precisão do produtor da amostra completa o modelo tende a classificar
ligeiramente melhor as quadrículas de ausência. A precisão do utilizador é no entanto
superior para as quadrículas de presença.
63
3. Resultados
Tabela 3.24 Medidas de qualidade de ajustamento do modelo para um ponto de corte de 0.6 (Aus. - ausências; Pres. - presenças). Modelo Precisão do produtor Precisão do utilizador D D/g.l. X2 X2/g.l.
Na figura 3.16 está representada a relação de cada variável com a respectiva
variável ajustada, após o ajustamento de um modelo aditivo generalizado com as variáveis
incluídas no modelo 4. Verifica-se um desvio à linearidade mais acentuado na covariável
RADS, confirmado pelo resultado dos testes estatísticos do modelo aditivo (Tabela 3.25).
Porém, verificou-se que o re-escalonamento da variável não provocava um acréscimo
significativo das medidas de qualidade de ajustamento do modelo.
Figura 3.16 Relação entre cada variável incluída no modelo 4 e a respectiva variável ajustada com um modelo aditivo generalizado.
Tabela 3.25 Sumário do modelo aditivo generalizado (s - função de suavização, g. l. - graus de liberdade, LRS - teste G ou estatística de quociente de verosimilhanças). Deviance = 47.707 (para 69.457 g. l.) LRS = 56.232
Os gráficos de diagnóstico do modelo (Figura 3.17), mostram que os outliers mais
importantes correspondem a quadrículas de presença da espécie, o que justifica os menores
valores de percentagem de quadrículas correctamente classificadas obtidos para esta classe.
Figura 3.17 Gráficos de diagnóstico da regressão logística
3.2.2.3 Árvores de classificação
Para esta espécie foi obtido apenas um modelo, uma vez que para ambas as
matrizes de treino (com e sem as variáveis ESTE e NORT), após as operações de “poda”,
as árvores resultaram iguais. O modelo resultante inclui as variáveis RADS, ESCO e
ECOL e possui 4 nós terminais (Figura 3.18).
Segundo o modelo a espécie ocorre para valores de RADS superiores ou iguais a 4
(150-155 kcal/cm2) e valores de ESCO inferiores ou iguais a 3 (50-100mm) ou para
valores de ESCO superiores ou iguais a 4 (100-150mm) e classes de ECOL superiores ou
iguais a 6 (apenas regiões mediterrânicas).
A covariável mais importante na discriminação das classes é a RADS, dando
origem a um nó terminal de “ausência” com uma probabilidade de erro apenas de 0.075
(Tabela 3.26). De seguida a covariável ESCO dá origem a um nó terminal de “presença”
com uma probabilidade de erro nula (Tabela 3.26). Por fim, a covariável ECOL origina
dois nós terminais, um de “ausência” e um de “presença”, ambos com uma probabilidade
de erro de 0.2857 (Tabela 3.26).
65
3. Resultados
Figura 3.18 Árvore de classificação. Tabela 3.26 Estrutura interna da árvore de classificação (n - nº de observações; D - deviance; * - nós terminais; os números dos nós correspondem aos números da árvore original, antes de se proceder à sua simplificação). Nó n D Resposta Probabilidades
Na tabela 3.27 apresentam-se os valores de precisão do produtor e do utilizador e os
valores absolutos e ponderados de deviance, respectivamente, para as amostras de treino,
validação e completa. A árvore classifica correctamente 84.48 % do total de quadrículas e
em média 84.07% das quadrículas afectas a uma das classes estão bem classificadas. Em
termos de precisão do produtor da amostra completa, as quadrículas de presença são
ligeiramente melhor classificadas do que as de ausência. A precisão do utilizador é no
entanto superior para as quadrículas de ausência.
66
3. Resultados
Tabela 3.27 Medidas de qualidade de ajustamento do modelo para um ponto de corte de 0.5 (Aus. - ausências; Pres. - presenças). Modelo Precisão do produtor Precisão do utilizador D D/g.l.
Aus. Pres. Total Aus. Pres. Média
Amostra de treino
87.50 83.33 85.90 87.50 77.27 82.39 54.83 0.74
Amostra de validação
73.68 89.47 81.58 89.36 80.65 85.00 29.66 0.87
Amostra completa
83.58 85.71 84.48 88.89 79.25 84.07 84.49 0.75
3.2.2.4 Comparação e integração dos modelos
Os melhores modelos de distribuição de Eor segundo os duas abordagens estatísticas
adoptadas - árvores de classificação e regressão logística - apresentam em comum a
inclusão de duas covariáveis: RADS e ESCOA. Segundo ambos os modelos estas variáveis
interagem entre si no seu efeito sobre a presença da espécie. A árvore de classificação
inclui ainda a covariável ECOL.
Na figura 3.19 apresentam-se os valores de precisão do ponto de vista do produtor
para a amostra completa, segundo os dois modelos de distribuição de Eor. A precisão total
é igual para os dois modelos (84.48%), mas para a árvore de classificação, ao contrário do
que sucede para o modelo de regressão logística, as quadrículas de presença são melhor
classificadas do que as de ausência. Por outro lado, para o modelo de regressão logística
verifica-se um maior equilíbrio entre as quadrículas de presença e de ausência bem
Figura 3.20 Precisão de classificação do ponto de vista do utilizador das quadrículas de ausência e de presença da amostra original e respectiva média.
68
3. Resultados
Cerca de 90% das quadrículas da amostra completa foram classificadas de igual
modo pela árvore de classificação e pelo modelo de regressão logística. Por outro lado,
cerca de 79% das quadrículas foram simultaneamente bem classificadas pelos dois
modelos.
Na tabela 3.28 apresentam-se as precisões de classificação da amostra completa
considerando apenas as quadrículas de consenso entre os dois modelos. Há um aumento de
confiança de 3.98% do ponto de vista do produtor em relação aos modelos considerados
separadamente, avaliados com a amostra completa de quadrículas. Do ponto de vista do
utilizador esse aumento é de 4.39% em relação à precisão da árvore de classificação e de
4.42% em relação ao modelo de regressão logística. Os valores de deviance ponderados
pelos graus de liberdade para estas quadrículas apresentam um decréscimo de 0.12 e de 0.1
valores em relação aos valores obtidos, respectivamente, com a árvore de classificação e
com o modelo de regressão logística para o total de quadrículas amostradas.
Tabela 3.28 Medidas de qualidade de ajustamento do modelo para as quadrículas de consenso entre os modelos.
Precisões de classificação Deviance dos resíduos
Precisão do produtor Precisão do utilizador Árvore de classificação Regressão logística
Aus. Pres. Total Aus. Pres. Média D D/g.l. D D/g.l.
3.3 Comparação entre a distribuição de Mauremys leprosa e de Emys orbicularis
O resultado do teste de Kolmogorov-Smirnov para duas amostras (Tabela 3.29) revela a
ocorrência de diferenças significativas (p<0.05) entre as duas classes (presença das duas
espécies e presença apenas de Mle) nas distribuições de seis covariáveis quantitativas:
PREC, HUMI, ESCO, RADS, ALTI e NORT. Segundo o teste de Mann-Whitney (Tabela
3.29) ocorrem diferenças significativas (p<0.05) entre os valores médios das duas classes
em mais duas covariáveis: INSO e ECOL. As diferenças mais significativas verificam-se
nas covariáveis ESCO e ALTI (p<0.0005).
Os gráficos da figura 3.21 mostram como variam a média e a dispersão dos dados
com a ausência e a presença da espécie para as variáveis onde se verificaram diferenças
significativas. Nas quadrículas onde surgem as duas espécies os valores de HUMI e RADS
são tendencialmente mais elevados e os de PREC, ESCO, ALTI e NORT tendencialmente
mais baixos.
Tabela 3.29 Resultados do teste de Kolmogorov-Smirnov (K.-S.) e do teste de Mann-Whitney (M.-W.) para cada variável quantitativa (s - desvio padrão).
Variáveis M. l. M. l. / E. o. K. - S. M. - W. Média s Média s p p TEMP 4.571 0.850 4.767 0.504 n.s. n.s. PREC 4.446 1.413 3.433 1.569 <0.05 <0.005 HUMI 3.107 0.966 3.867 1.008 <0.05 <0.005 ESCO 5.071 1.333 3.967 1.650 <0.05 <0.0005 EVAP 4.054 1.017 3.667 1.322 n.s. n.s. INSO 10.446 1.877 11.433 1.888 n.s. <0.05 RADS 4.036 1.095 4.767 1.278 <0.05 <0.005 ALTI 3.946 1.257 2.767 1.382 <0.05 <0.0005 ECOL 5.393 1.139 6.100 1.029 n.s. <0.05 SOLO 3.625 1.019 3.267 1.285 n.s. n.s. GEAD 5.125 1.779 4.167 1.877 n.s. n.s. DPOP 1.875 1.096 1.767 1.501 n.s. n.s. ESTE 17.000 5.474 15.400 5.506 n.s. n.s. NORT 27.179 14.890 17.367 11.657 <0.05 <0.005
70
3. Resultados
Figura 3.21 Média Desvio padrão (SD) das variáveis quantitativas (testes de Mann-Whitney e Kolmogorov-Smirnov significativos p<0.05) para cada classe. (continua na página seguinte).
±
Figura 3.21 (continuação) Média Desvio padrão (SD) das variáveis quantitativas (testes de Mann-Whitney e Kolmogorov-Smirnov significativos p<0.05) para cada classe.
±
71
3. Resultados
No que se refere às covariáveis qualitativas, não se observa uma influência
significativa (p<0.01) de nenhuma das variáveis consideradas (Tabela 3.30).
Tabela 3.30 Resultados dos testes de χ2 (1 grau de liberdade) para cada variável qualitativa (os valores a bold são significativos a 99% de confiança; (+) - influência positiva sobre a presença de ambas as espécies, (-) - influência negativa sobre a presença de ambas as espécies). Variáveis X2 (1 g.l.) p FOLH 0.750 0.385 RESI 1.330 0.248 OLIV 1.790 0.182 SOBR 3.070 0.080 AZIN 2.380 0.123 CARV 0.210 0.650 PINH 1.330 0.248 EUCT 0.480 0.489 CAST 0.520 0.472 FIGU 1.470 0.225 MEDR 1.670 0.197 ALFA 0.060 0.805 AMEN 1.380 0.240 CUARV 2.180 0.140 CARBS 5.380 0.020 CARBR 1.040 0.309 CAVAB 1.670 0 .197 CABAV 0.400 0.526 INCT 0.470 0.494 SAL 1.890 0.169
72
3. Resultados
3.4 Representação geográfica dos modelos
3.4.1 Mauremys leprosa
Modelos probabilísticos
Nas figuras 3.22 A e B estão representadas as superfícies de probabilidade de ocorrência
de Mle em Portugal segundo, respectivamente, o modelo de regressão logística e o modelo
baseado em árvores de classificação. Em ambos os modelos as probabilidades de
ocorrência da espécie mais elevadas situam-se nas regiões do Alentejo, Algarve, Beira
Interior e Nordeste Transmontano. Note-se que modelo baseado em árvores de
classificação (Figura 3.22 B) é bastante mais simples, gerando apenas cinco níveis de
probabilidade, correspondentes ao número de nós terminais da árvore.
A B
Figura 3.22 Superfície de probabilidade de ocorrência de Mle. A - Regressão logística; B - Árvore de classificação.
73
3. Resultados
Para simplificar a representação do modelo de regressão logística (Figura 3.23)
consideraram-se três níveis de acordo com a relação entre as probabilidades (pontos de
corte) e as medidas de precisão do utilizador (ver secção 3.2.1.2, figura 3.6, pág.47): (1)
zona com uma precisão de classificação de ausências superior a 90% (aproximadamente
para probabilidades de ocorrência inferiores a 0.2), (2) zona de “confusão” (precisões
inferiores a 90%) e (3) zona com uma precisão de classificação de presenças superior a
90% (aproximadamente para probabilidades de ocorrência superiores a 0.8)
Figura 3.23 Modelo de regressão logística segundo níveis de precisão do utilizador.
74
3. Resultados
Modelos determinísticos
Quando se agrupam os níveis de probabilidade em classes de presença/ausência segundo os
melhores pontos de corte, originam-se os mapas das figuras 3.24 A e B , respeitantes ao
modelo de regressão logística e ao modelo baseado em árvores de classificação,
respectivamente. Nestes mapas estão representados também os locais de ocorrência
conhecidos para a espécie, de modo a permitir uma avaliação visual dos modelos. Verifica-
se que segundo o modelo de regressão logística a área correspondente à classe de presença
(71.2% da área total) é consideravelmente superior à mesma área segundo o modelo
baseado em árvores de classificação (51% da área total).
A B
Figura 3.24 Representação espacial dos modelos e locais de ocorrência de Mle (assinalados a branco). A - Regressão logística; B - Árvore de classificação.
75
3. Resultados
Integração dos modelos
A figura 3.25 resulta da sobreposição dos mapas preditivos segundo os dois modelos
originando 3 tipos de áreas: duas áreas classificadas como ausência e como presença por
ambos os modelos (áreas de consenso) e uma área onde os resultados da classificação
foram diferentes para os dois modelos (área de discordância).
Figura 3.25 Sobreposição dos mapas resultantes dos dois modelos (os locais de ocorrência estão assinalados a branco).
76
3. Resultados
3.4.2 Emys orbicularis
Modelos probabilísticos
As superfícies de probabilidade de ocorrência de Eor estão representadas nas figuras 3.26
A e B. Segundo ambos os modelos a maioria do território, principalmente a Norte do Tejo,
possui baixas probabilidades de ocorrência da espécie. Os modelos têm algumas
semelhanças entre si, diferindo sobretudo na sua complexidade. Para ambos os modelos as
maiores probabilidades de ocorrência situam-se principalmente nas zonas de planície
alentejana e costa algarvia, e as mais baixas situam-se a Norte do Tejo, nas serras algarvias
(Serras do Caldeirão, de Monchique e de Espinhaço de Cão) e alentejanas (Serras do
Cercal, de Grândola e de Monfurado).
A B
Figura 3.26 Superfície de probabilidade de ocorrência de Eor. A - Regressão logística; B - Árvore de classificação.
77
3. Resultados
Na figura 3.27 está representado o mapa simplificado relativo ao modelo de
regressão logística. Consideraram-se três níveis de acordo com a relação entre as
probabilidades (pontos de corte) e as medidas de precisão do utilizador (ver secção 3.2.2.2,
figura 3.15, pág. 63): (1) zona com uma precisão de classificação de ausências superior a
90% (aproximadamente para probabilidades de ocorrência inferiores a 0.3), (2) zona de
“confusão” (precisões inferiores a 90%) e (3) zona com uma precisão de classificação de
presenças superior a 90% (aproximadamente para probabilidades de ocorrência superiores
a 0.7).
Figura 3.27 Modelo de regressão logística segundo níveis de precisão do utilizador.
78
3. Resultados
Modelos determinísticos
Nas figuras 3.28 A e B estão representados os mapas preditivos da distribuição de Eor
segundo, respectivamente, o modelo de regressão logística e o modelo baseado em árvores
de classificação. Também se encontram assinalados os locais conhecidos de ocorrência. A
área de distribuição potencial da espécie não difere muito entre os dois modelos,
representando 35,7 % da área total para o modelo baseado em árvores de classificação e
34,3% da área total para o modelo de regressão logística. Ambos os modelos classificaram
erradamente como “ausência” alguns locais com populações conhecidas, tais como o Paul
da Tornada (Caldas da Rainha, Estremadura) e as Lagoas do Prado (Vila Verde, Minho).
A B
Figura 3.28 Representação espacial dos modelos e locais de ocorrência de Eor (assinalados a branco). A - Regressão logística; B - Árvore de classificação.
79
3. Resultados
Integração dos modelos
Na figura 3.29 estão representadas as áreas de consenso e de discordância entre os
modelos. Para esta espécie a área de discordância resultou relativamente pequena.
Figura 3.29 Sobreposição dos mapas resultantes dos dois modelos (os locais de ocorrência estão assinalados a branco).
80
3. Resultados
3.5 Influência de variáveis locais
3.5.1 Mauremys leprosa
3.5.1.1 Análise univariada
Os testes ANOVA de Kruskal-Wallis (Tabela 3.31) mostram que ocorrem diferenças
significativas (p<0.01) entre os níveis de abundância para nove variáveis quantitativas:
LARG, PROF, VCOR, INSO, EMER, IMER, HERB, ARBS e ARBR. Os gráficos da
figura 3.30 mostram como variam a média e a dispersão dos dados com os níveis de
abundância para estas variáveis. A abundância de cágados parece assim estar
positivamente relacionada com a profundidade, a insolação, a cobertura de vegetação
emergente e imersa, e negativamente relacionada com a velocidade da corrente, o grau de
cobertura de vegetação herbácea, arbustiva e arbórea da margem. A largura é em média
superior e tem, simultaneamente, maior variação nos pontos onde se observaram níveis
intermédios de abundância.
Tabela 3.31 Resultados dos testes ANOVA de Kruskal-Wallis para cada variável quantitativa. (+) - influência positiva na presença da espécie; (-) - influência negativa sobre a presença da espécie; (n.s.) - resultado não significativo a 99% de confiança. Variáveis “Rank” Teste de Kruskal-Wallis
Figura 3.30 Média Desvio padrão (SD) das variáveis quantitativas (testes de Kruskal-Wallis significativos p<0.05) para cada classe. (continua na página seguinte).
±
82
3. Resultados
Figura 3.30 (continuação) Média Desvio padrão (SD) das variáveis quantitativas (testes de Kruskal-Wallis significativos p<0.05) para cada classe.
±
Quanto às variáveis qualitativas, os testes de χ2 (Tabela 3.32) mostram que as
variáveis EOR, ORIE, HABI, e AFLO apresentam uma influência significativa (p<0.01) na
abundância da espécie. Nos gráficos da figura 3.31 estão representados os histogramas por
nível de abundância para estas variáveis. O nível de abundância da espécie parece estar
positivamente relacionado com a presença de Eor, com a presença de habitats palustre e
palustre-riverino e com a presença de substrato rochoso. A influência da orientação
dominante não é clara devido ao elevado número de classes.
Tabela 3.32 Resultados dos testes de χ2 para cada variável qualitativa. g. l. - graus de liberdade; (+) - influência positiva na abundância da espécie; (-) - influência negativa sobre a abundância da espécie; (n.s.) - resultado não significativo a 99% de confiança. Variáveis g. l. X2 p
Figura 3.31 Histogramas das variáveis qualitativas (testes de χ2 significativos p<0.01) para cada classe.
3.5.1.2 Análise multivariada
Modelo completo
O resultado do ajustamento da árvore de classificação em que todas as variáveis foram
inicialmente consideradas na análise (Figura 3.32) sugere que, para os diferentes tipos de
habitat considerados, diferentes variáveis associadas aos habitats aquáticos influenciam a
abundância das espécies. Com efeito, as duas separações principais são introduzidas pela
variável HABI, dando origem a três grupos de habitats: (1) habitats palustre, palustre-
lacustre e palustre-riverino; (2) habitat riverino; e (3) habitats lacustre, lacustre-palustre e
riverino-palustre.
Segundo este modelo, no primeiro grupo de habitats a abundância das espécie é alta
ou média. Neste grupo as variáveis EMER e PROF são as mais importantes na separação
entre os níveis médio e alto de abundância; as maiores abundâncias verificam-se para
maiores percentagens de cobertura de vegetação emergente (25% a 100%) ou para níveis
de profundidade intermédios (0.5 a 1 m).
84
3. Resultados
Nos habitats riverinos a espécie ou não ocorre ou surge com níveis intermédios de
abundância. As variáveis PROF, IMER e HERB são as que mais determinam a presença ou
ausência da espécie neste tipo de habitats; a espécie ocorre quando o nível de profundidade
é superior a 0.25 m, quando a percentagem de cobertura de vegetação imersa é superior a
50% ou quando a percentagem de cobertura de vegetação herbácea na margem é inferior a
25%.
No terceiro grupo de habitats a espécie surge com abundâncias intermédias ou
altas. Neste grupo as variáveis ARBR e INSO são as mais importantes na separação entre
os níveis médio e alto de abundância; as maiores abundâncias verificam-se para
percentagens de cobertura arbórea superiores a 50% e para níveis de insolação superiores a
2.
Na tabela 3.23 apresenta-se a estrutura interna da árvore de classificação que inclui
o número de casos, os valores de deviance e as probabilidades associadas a cada classe em
cada nó. Cerca de 65% das observações no primeiro grupo de habitats foram classificadas
no nível de abundância alta, 54% das observações do segundo grupo foram classificadas
no nível ausência, e 92% das observações no terceiro grupo foram classificadas no nível
média. A partir das probabilidades associadas aos nós terminais foi possível determinar a
precisão média de classificação da árvore para cada um dos três grupos de habitats. Assim,
para o primeiro grupo de habitats a probabilidade média de classificações correctas é de
81.65%, para o segundo grupo é de 83.02% e para o terceiro grupo é de 67.36%.
Figura 3.32 Árvore de classificação após as operações de poda.
85
3. Resultados
Tabela 3.33 Estrutura interna da árvore de classificação seleccionada (n - nº de observações; D - deviance; * - nós terminais; os números dos nós correspondem aos números da árvore original, antes de se proceder à sua simplificação).
Nó n D Resposta Probabilidades (alta ausência média) 1) raiz 249 466.80 média ( 0.1285 0.2892 0.5823)
2) HABITATS:pal,pal/lac,pal/riv 49 85.99 alta (0.5102 0.0612 0.4286)
4) EMER<1.5 32 53.15 média (0.0625 0.6250 0.3125)
8) PROF<3.5 20 34.23 alta (0.0500 0.4500 0.5000)
16) PROF<2.5 5 5.00 média (0.2000 0.8000 0.0000) *
17) PROF>2.5 15 19.10 alta (0.0000 0.3333 0.6667) *
9) PROF>3.5 12 6.88 média (0.0833 0.9167 0.0000) *
5) EMER>1.5 17 15.09 alta (0.0588 0.0588 0.8824) *
3) HABITATS:lac,lac/pal,riv,riv/pal 200 312.30 média (0.3450 0.6200 0.0350)
107) LARG>3.5 23 31.49 média (0.4348 0.5652 0.0000) *
27) IMER>1.5 6 0.00 média (0.0000 1.0000 0.0000) *
7) HABITATS:lac,lac/pal,riv/pal 116 151.50 média (0.1724 0.7759 0.0517)
14) ARBR<1.5 60 39.42 média (0.0667 0.9167 0.0167) *
15) ARBR>1.5 56 97.15 média (0.2857 0.6250 0.0893)
30) INSOL<2.5 47 67.77 média (0.3191 0.6596 0.0213) *
31) INSOL>2.5 9 17.37 alta (0.1111 0.4444 0.4444) *
As medidas de qualidade de ajustamento do modelo apresentam-se na tabela 3.34.
O modelo classificou correctamente 77.5% dos pontos de amostragem com um valor
ponderado de deviance de 1.1. A validação cruzada resultou numa média de cerca de 70%
de classificações correctas e um valor médio ponderado de deviance de 1.9.
86
3. Resultados
Tabela 3.34 Medidas de qualidade de ajustamento do modelo à amostra de treino e segundo a validação cruzada (D - deviance; g.l. - graus de liberdade = 237). Precisão total (%) D D / g.l.
Amostra de treino 77.51 258.962 1.088
Validação cruzada 69.88 445.436 1.879
Os resultados da matriz de confusão estão representados graficamente na figura
3.33. Do ponto de vista da precisão do produtor (nº de observações pertencentes a
determinada classe que foram correctamente classificadas) cerca de 53% das observações
correspondentes ao nível ausência, 89% correspondentes ao nível média e 91%
correspondentes ao nível alta foram correctamente classificadas. Do ponto de vista da
precisão do utilizador (nº de observações afectas a uma classe e que na realidade são dessa
classe) cerca de 83% das observações classificadas como ausência, 79% classificadas
como média e 73% classificadas como alta, pertenciam realmente a essas classes.
Tanto do ponto de vista do produtor como do utilizador verificou-se um número
maior de trocas entre os níveis de abundância ausência e média e entre os níveis média e
Figura 3.33 Medidas de precisão (%) do ponto de vista do produtor (A) e do utilizador (B) obtidas a partir da matriz de confusão.
Influência das características dos meios aquáticos
Na figura 3.34 está representada a árvore de classificação em que se considerou apenas o
efeito de variáveis associadas às características dos meios aquáticos (não entraram na
análise as variáveis: tipo de habitat, orientação, declive e altitude), apresentando-se a
estrutura interna na tabela 3.35. A separação mais importante é introduzida pela variável
PROF que dá origem ao único nó de ausência para valores inferiores a 0.25 m
88
3. Resultados
(probabilidade de 0.77) (Tabela 3.35). A segunda separação mais importante é introduzida
pela variável EMER. Para coberturas de vegetação emergente inferiores a 50%, as
variáveis com maior influência são a ARBR, a INSOL e a TURB na separação entre
abundâncias média e alta; dos quatro nós terminais apenas um corresponde a abundâncias
altas (probabilidade de 0.6) para coberturas de vegetação arbórea superiores a 50%, níveis
de insolação superiores a 2 e níveis de turbidez inferiores a 1. Para valores de cobertura de
vegetação emergente, a variável mais importante na discriminação entre abundâncias
médias e altas é a IMER; para valores de cobertura de vegetação imersa inferiores a 0.25 a
abundância é média (probabilidade de 0.73); para valores superiores a 25% a abundância é
alta (probabilidade de 0.7).
Figura 3.34 Árvore de classificação após as operações de poda.
89
3. Resultados
Tabela 3.35 Estrutura interna da árvore de classificação seleccionada (n - nº de observações; D - deviance; * - nós terminais; os números dos nós correspondem aos números da árvore original, antes de se proceder à sua simplificação).
Nó n D Resposta Probabilidades (alta ausência média) 1) raiz 249 466.80 média ( 0.1285 0.2892 0.5823 )
A classificação obtida com este modelo, segundo as suas medidas da qualidade de
ajustamento (Tabela 3.36), apresenta piores resultados do que o modelo anterior, em que se
incluiu na análise todas as variáveis locais. O modelo classificou correctamente cerca de
70% dos pontos de amostragem, com uma deviance ponderada de 1.317. A validação
cruzada resultou numa média de cerca de 64% de classificações correctas e um valor
médio ponderado de deviance de 2.141.
Tabela 3.36 Medidas de qualidade de ajustamento do modelo à amostra de treino e segundo a validação cruzada (D - deviance; g.l. - graus de liberdade = 242). Precisão total (%) D D / g.l.
Amostra de treino 70.68 318.800 1.317
Validação cruzada 63.86 469.484 2.141
Os resultados da matriz de confusão estão representados graficamente na figura
3.35. Do ponto de vista da precisão do produtor foram correctamente classificadas cerca de
90
3. Resultados
38% das observações correspondentes ao nível ausência, 90% correspondentes ao nível
média e 59% correspondentes ao nível alta. Do ponto de vista da precisão do utilizador
cerca de 77% das observações classificadas como ausência, 70% classificadas como média
e 69% classificadas como alta, pertenciam realmente a essas classes.
Tal como para o modelo anterior, tanto do ponto de vista do produtor como do
utilizador verificou-se um número maior de trocas entre os níveis de abundância ausência
e média e entre os níveis média e alta do que entre os níveis ausência e alta.
Figura 3.36 Média Desvio padrão (SD) das variáveis quantitativas (testes deMann-Whitney significativos p<0.05) para cada classe.
±
Quanto às variáveis qualitativas, os testes de χ2 (Tabela 3.38) mostram que as variáveis
MLE, HABI, e CASC apresentam uma influência significativa (p<0.01) na presença de
ambas as espécies relativamente à presença única de Mle. Nos gráficos da figura 3.37 estão
representados os histogramas por nível de abundância para estas variáveis. Segundo os
resultados a espécie apresenta uma maior tendência para ocupar locais com abundâncias
mais elevadas de Mle, surge com maior frequência em habitats palustres e palustres-
riverinos, e tem menor tendência para ocupar habitats com substrato de cascalho.
93
3. Resultados
Tabela 3.38 Resultados dos testes de χ2 para cada variável qualitativa. g. l. - graus de liberdade; (+) - influência positiva na abundância da espécie; (-) - influência negativa sobre a abundância da espécie; (n.s.) - resultado não significativo a 99% de confiança. Variáveis g. l. X2 p
Figura 3.37 Histogramas das variáveis qualitativas (testes de χ2 significativos p<0.01) para cada classe.
94
4. Discussão
4. DISCUSSÃO
4.1 Interpretação ecológica dos modelos de distribuição
Os modelos de distribuição que foram produzidos explicaram uma percentagem razoável
(cerca de 80% para Mle e cerca de 84% para Eor) da distribuição observada das espécies à
escala e resolução adoptadas. Estas estimativas de precisão total foram da mesma ordem de
grandeza das obtidas em trabalhos idênticos (Walker, 1996; Pereira & Itami, 1991; Brito et
al., 1996), sendo raros os trabalhos onde os modelos ultrapassam os 90% de precisão (por
exemplo: Austin et al., 1996; Teixeira et al., 1996).
A precisão dos modelos de distribuição depende em grande medida da capacidade
preditiva das variáveis disponíveis e da resolução e robustez dos dados, mas também do
maior ou menor grau de exigência das espécies em relação a determinados factores. Por
exemplo, Teixeira et al. (1996) construiu modelos de regressão logística para uma espécie
com exigências ecológicas muito restritas (salamandra-dourada), tendo estimado uma
precisão total de 94.2%, sendo a sua presença fortemente influenciada pela precipitação e
declive.
A interpretação ecológica dos modelos é geralmente uma tarefa difícil, uma vez que
os factores envolvidos nos modelos podem não actuar directamente na distribuição das
espécies mas antes estar correlacionados ou interactuar com factores não considerados na
análise. Pode até suceder o caso extremo de nenhuma das variáveis incluídas num modelo
actuarem sobre as espécies. Por outro lado, outra dificuldade de interpretação advém do
facto das variáveis macro-ambientais influenciarem não apenas directamente a
distribuição, mas também o tipo de habitats disponíveis.
Numa tentativa de obviar parte do problema, recorde-se que se ajustaram um
grande número de modelos válidos, tendo-se seleccionado aquele que simultaneamente
possuía melhores medidas de qualidade de ajustamento e o maior significado possível à luz
dos conhecimentos sobre a ecologia das espécies. Partiu-se ainda do pressuposto que o
número de vezes que determinada variável entrava em modelos independentes era, de certo
modo, uma indicação da sua importância relativa na distribuição das espécies. Por último,
o número de vezes que as variáveis que eram simultaneamente incluídas nos modelos
segundo as duas técnicas de modelação adoptadas, foi também considerado como uma
medida da sua importância para a ocorrência da espécie.
95
4. Discussão
É importante salientar que as variáveis incluídas no Atlas do Ambiente de Portugal
são muito incompletas, faltando nomeadamente variáveis que reflictam a sua variação
sazonal, o que seria útil por exemplo para avaliar a instabilidade climática (Romero &
Real, 1996). Por outro lado, o grau de detalhe da cartografia das variáveis é muito baixo, o
que pode limitar a sua capacidade preditiva.
Mauremys leprosa
Para Mle as variáveis que surgiram mais do que duas vezes no conjunto dos modelos e
simultaneamente nas duas abordagens estatísticas utilizadas foram a radiação solar, a
evapotranspiração real, a humidade relativa, as variáveis espaciais (nº da linha e nº da
coluna na rede UTM 10 x 10 km), o escoamento, a precipitação e as regiões ecológicas
(informação fito-edafo-climática).
A elevada frequência de ocorrência nos modelos das variáveis espaciais mostra que
provavelmente existem outros factores importantes que estão correlacionados com elas.
Outra hipótese é a distribuição ser também influenciada por factores meramente
biogeográficos, ou seja, mesmo que em determinadas regiões hajam condições para a
ocorrência da espécie, ela não está presente porque outros factores (por exemplo barreiras
naturais) impediram a sua colonização. Estas variáveis nunca foram incluídas nos modelos
seleccionados, uma vez que retiravam o seu significado ecológico. Note-se que as restantes
seis variáveis mais importantes são todas de natureza climática, pelo que se deduz que o
clima é um factor importante na distribuição desta espécie.
O factor mais importante na ecologia dos répteis é a temperatura, uma vez que
dependem de fontes externas de calor para manterem a temperatura ideal à sobrevivência e
reprodução (Spellerberg, 1982; Heatwole & Taylor, 1987). Em última análise dependem da
energia radiante do sol, quer directamente (radiação directa) quer indirectamente (radiação
reflectida ou através de objectos aquecidos por energia radiante) (Heatwole & Taylor,
1987). Segundo os modelos obtidos, a variável temperatura média do ar por si só não se
revelou uma variável importante. Outras medidas de temperatura como os respectivos
máximos e mínimos, ou a temperatura média por estação do ano, contribuiriam certamente
com mais informação. Não obstante este facto e atendendo a que as tartarugas da família
Emydidae em geral controlam a temperatura através da menor ou maior exposição à
radiação solar directa (Crawford et al., 1983), medidas como a radiação solar ou a
insolação são provavelmente mais determinantes do que as medidas de temperatura. Com
96
4. Discussão
efeito, segundo os modelos obtidos a radiação solar é das variáveis mais importantes,
senão a mais importante, na distribuição desta espécie. Tal não é de estranhar uma vez que,
ao contrário, por exemplo, da insolação (nº de horas de exposição solar), esta variável é
uma medida da quantidade de energia radiante que chega ao solo. Segundo a árvore de
classificação a espécie ocorre apenas para valores de radiação solar superiores ou iguais a
145 kcal/cm2. Esta variável é provavelmente a que tem um efeito mais directo na presença
de Mle.
Uma vez que os cágados ocorrem em meios aquáticos, a precipitação é um factor
que pode influenciar a sua ocorrência. No entanto, segundo os modelos obtidos o seu efeito
não é muito evidente. De acordo com a árvore de classificação seleccionada, a espécie está
presente quando a precipitação é inferior a 600 mm. Para valores de precipitação
superiores, esta variável interage com as variáveis humidade e regiões ecológicas. No
entanto, o ajustamento do modelo aditivo generalizado baseado no primeiro modelo de
regressão logística seleccionado, mostra que a relação é positiva para valores de
precipitação inferiores a 1200 mm e negativa para valores superiores a este número. Estes
resultados contraditórios poderão estar relacionados com possíveis interacções com outras
variáveis. Porém, a precipitação apresenta certamente uma grande influência ao nível dos
habitats, uma vez que actua directamente na disponibilidade e no tipo predominante de
meios aquáticos. Pode ainda pensar-se que para valores baixos de precipitação o seu efeito
é positivo uma vez que determina a quantidade de água disponível; para valores elevados o
seu efeito é negativo uma vez que provoca um aumento da velocidade da corrente dos
cursos de água. Segundo os resultados do estudo da influência de variáveis locais na
abundância da espécie, a velocidade da corrente apresenta um efeito claramente negativo.
No caso do escoamento, que resulta em grande medida da quantidade de
precipitação e do declive dos terrenos, o seu efeito directo é mais evidente. Segundo os
modelos obtidos, esta variável apresenta um efeito marcadamente negativo sobre a
presença da espécie. A relação directa entre o escoamento e a velocidade da corrente nos
leitos dos cursos de água explica muito provavelmente este comportamento.
Quer a análise univariada quer os modelos obtidos mostram uma influência
considerável da evapotranspiração real na distribuição de Mle. Para todos os modelos a sua
influência na presença da espécie é negativo. Segundo três das oito árvores de classificação
ajustadas a espécie está presente apenas para valores de evapotranspiração inferiores ou
iguais a 700 mm (resultados não apresentados), sendo este o primeiro factor que divide a
raiz. Porém, o seu efeito directo sobre a espécie não é claro. Esta variável depende de
97
4. Discussão
muitos factores como a quantidade de água nos solos, da densidade de cobertura de
vegetação e da temperatura. É provável que este factor actue ao nível dos habitats,
nomeadamente no que se refere ao grau e tipo de cobertura das margens dos meios
aquáticos. Por outro lado, pode estar correlacionado com outras variáveis não disponíveis
que actuam directamente sobre a espécie.
Quanto à humidade, por um lado as análises univariadas não mostram uma
influência muito acentuada na presença da espécie, mas por outro lado surge num grande
número de modelos, incluindo os dois seleccionados. Nas árvores de classificação esta
variável surge principalmente nas separações com menor significado. De acordo com a
árvore de classificação seleccionada, a espécie está ausente para valores iguais ou
superiores a 75% de humidade. Segundo os modelos de regressão logística o seu efeito é
igualmente negativo, sendo a variável que mais vezes está incluída nos modelos. Uma vez
que se trata de uma espécie tipicamente aquática o papel da humidade no balanço hídrico é
muito reduzido, não sendo por isso à partida um factor limitante da sua presença. Tal como
a evapotranspiração, este factor deve actuar ao nível dos habitats ou estar correlacionado
com outra variável importante.
Quanto às regiões ecológicas, a sua categorização é baseada sobretudo nas
comunidades vegetais, resultando assim do efeito de uma gama diversificada de variáveis
climáticas. As regiões ecológicas devem portanto determinar os tipos de habitat aquático
dominantes. Para ambas as abordagens estatísticas, a percentagem de presenças da espécie
é maior para os climas de carácter mais mediterrâneos. Segundo a árvore de classificação a
espécie está presente nas quatro regiões mediterrâneas e ainda na região Sub-Montano -
Termo-Subatlântico.
Emys orbicularis
Quanto a Eor, foram simultaneamente incluídas nos dois modelos seleccionados as
variáveis radiação solar e escoamento. Tal como para a espécie anterior, a radiação solar
parece ser a variável mais importante para esta espécie. Segundo a árvore de classificação
a espécie ocorre apenas para valores de radiação solar superiores ou iguais a 150 kcal/cm2.
As considerações feitas para Mle aplicam-se igualmente a esta espécie.
Segundo as duas abordagens estatísticas, a radiação solar e o escoamento interagem
no efeito sobre a presença da espécie. Na regressão logística a interacção é expressa pelo
98
4. Discussão
produto entre as duas, tendo um efeito negativo na presença. Com a árvore de classificação
a interacção é expressa de uma forma mais simples: o escoamento apenas tem efeito para
valores de radiação solar superiores a 150 kcal/cm2.
Outro factor importante incluído na árvore de classificação é a região ecológica.
Segundo este modelo a espécie está presente, para valores de escoamento superiores a 100
mm, apenas nas três regiões de carácter mais mediterrânico.
Por último, apesar de não estar incluída no modelo de regressão logística
seleccionado, a variável altitude (e respectiva transformação logarítmica) surge em seis dos
nove modelos ajustados. Esta espécie tende a ocupar regiões de menor altitude, o que
também se verificou a nível local. Este efeito pode estar relacionado com uma preferência
mais marcada desta espécie por habitats palustres (confirmada pelo estudo do efeito das
variáveis locais), que dum modo geral são mais frequentes a baixas altitudes. Por outro
lado, se a espécie se encontra em regressão em Portugal, tenderá a ocupar apenas os
habitats de melhor qualidade.
4.2 Avaliação e interpretação dos modelos segundo a sua representação geográfica
As precisões estimadas dos modelos podem ser extrapoladas com algum erro em termos de
área geográfica segundo a sua representação espacial. Assim, por exemplo, do ponto de
vista do produtor do mapa pode afirmar-se que cerca de 83% da área onde Mle está
presente (não esquecendo, porém, que a espécie se limita ao meio aquático) foi bem
classificada pela representação geográfica do modelo de regressão logística. Do ponto de
vista do utilizador do mapa pode afirmar-se que cerca de 84% da área representada como
estando a espécie presente está correctamente classificada.
Mauremys leprosa
As superfícies de probabilidade de ocorrência de Mle são bastante diferentes segundo os
dois métodos de modelação (Figura 3.22, pág. 73). Ao passo que no caso da árvore de
classificação apenas se geram cinco níveis de probabilidade correspondentes ao nós
terminais das árvores, no caso do modelo logístico as áreas possuem uma gama mais
contínua de probabilidades, resultando numa representação aparentemente mais realista.
99
4. Discussão
Quando se reclassifica a imagem correspondente ao modelo de regressão logística
de acordo com a distribuição da precisão do utilizador pelos pontos de corte, verifica-se
que uma grande parte das áreas mal classificadas situam-se na região periférica da
distribuição desta espécie (Figura 3.23, pág. 74), como por exemplo na Beira Litoral e
Estremadura. Esta “zona de confusão” pode ser interpretada como uma zona de maior
fragmentação da distribuição “sentida” pela resolução adoptada, uma vez que ocorre uma
“mistura” maior de quadrículas de presença com quadrículas de ausência. Este padrão
sugere a existência de um limite não “abrupto” da distribuição, estando de acordo com a
ideia de que as populações tendem a fragmentar-se no limite da área de distribuição,
restringindo-se apenas aos habitats mais propícios (Brown & Gibson, 1983). O erro de
classificação pode então em parte ser interpretado como uma medida do grau de
fragmentação da distribuição e, em última análise, da própria abundância das espécies.
Quanto aos mapas resultantes da classificação das imagens segundo os melhores
pontos de corte (Figura 3.24, pág. 75), o mapa relativo ao modelo de regressão logística
está, aparentemente, mais de acordo com a distribuição real da espécie. Tal não é de
estranhar, uma vez que apresenta valores de precisão das quadrículas de presença
superiores aos obtidos com a árvore de classificação. Por outro lado, os pontos de
ocorrência incluídos na área classificada como ausência não se encontram muito
distanciados dos limites da distribuição segundo o modelo de regressão logística.
A árvore de classificação, no entanto, classifica melhor as quadrículas de ausência,
pelo que se considerou importante integrar a informação dos dois modelos de modo a
definir “zonas de consenso” entre os dois modelos. Nestas zonas o grau de certeza da
classificação das áreas aumenta consideravelmente, segundo os resultados da precisão
quando se consideram apenas as quadrículas classificadas de igual modo pelos modelos
(secção 3.2.1.4, pág. 52).
No entanto, uma vez que se tem mais confiança nos dados de presença da espécie,
pensamos que o modelo que melhor reflecte a distribuição real da espécie é o modelo de
regressão logística.
Emys orbicularis
Tal como para a espécie anterior, a superfície de probabilidades resulta mais realista
segundo o modelo de regressão logística (Figura 3.26, pág. 77). Também para esta espécie
a “zona de confusão” situa-se nas regiões periféricas da distribuição, sobretudo no Alto
100
4. Discussão
Alentejo, nas serras do Algarvias e da costa Sudoeste e na região do Alto Douro. A “zona
de confusão” neste caso ocupa uma área substancialmente maior relativamente à área de
presença da espécie (133% da área de presença), do que no caso de Mle (43.7% da área de
presença). Isto deve-se a uma maior fragmentação da distribuição desta espécie, aliás
também confirmada pelo resultado do índice de raridade média local (Tabela 3.1, pág. 32).
Para Eor as precisões de classificação foram consideravelmente superiores do que
para Mle. No entanto, basearam-se numa amostra bastante mais reduzida, não tendo sido
construídos tantos modelos alternativos. Os mapas resultantes da classificação (Figura
3.27, pág. 78) são bastante idênticos entre os dois métodos, embora o mapa referente à
árvore de classificação esteja aparentemente um pouco mais de acordo com a distribuição
da espécie. Isto é confirmado pela precisão do produtor ligeiramente superior da árvore de
classificação para as quadrículas de presença. No entanto, ambos os modelos não
conseguiram prever a ocorrência da espécie em três pontos (situados na zona das Caldas da
Rainha, na zona da Golegã e no Minho, próximo de Vila Verde) que, por serem muito
distantes do limite da distribuição prevista, põem em causa a própria validade dos modelos.
De facto, os modelos revelaram-se muito eficazes na classificação da maioria das
quadrículas de presença uma vez que estas estão concentradas em regiões restritas do país.
A região classificada como ausência deverá ser então interpretada não como uma região de
ausência real das espécies, mas antes como uma região onde ocorre um elevado grau de
fragmentação, resultando em populações extremamente isoladas. Durante a fase terminal
deste trabalho foi-me relatada mais uma nova ocorrência desta espécie situada na região de
Chaves (Francisco Álvares, com. pess.), sendo de esperar que no futuro venham a ser
detectados novos pontos de ocorrência, situados igualmente muito longe dos limites de
distribuição segundo os modelos aqui apresentados.
A distribuição muito dispersa desta espécie e o facto de ser mais setentrional e
cosmopolita faz supor que esta deverá ter apresentado uma distribuição em Portugal
bastante mais alargada no passado, inclusivamente mais alargada do que a de Mle. Com
efeito, Bocage (1863 in Boscá, 1881) no século passado descreveu esta espécie como
sendo comum em Portugal. Estes resultados constituem então uma forte evidência da sua
regressão em Portugal.
101
4. Discussão
4.3 Influência de variáveis locais
A influência de variáveis locais foi estudada com um carácter mais exploratório e de
complemento à informação sobre a distribuição das espécies, sem a pretensão de se
efectuarem extrapolações e interpretações ecológicas muito exaustivas.
Mauremys leprosa
Esta espécie foi encontrada em todos as categorias de habitat aquático consideradas neste
trabalho. No entanto, os resultados da análise estatística univariada e dos modelos baseados
em árvores de classificação mostram uma clara preferência de Mle por habitats com uma
forte componente palustre, ou seja, ambientes de águas paradas, baixa profundidade e com
uma cobertura razoável de vegetação aquática. Segundo a árvore de classificação que
incluiu todas as variáveis consideradas, a espécie apenas está ausente em habitats riverinos
sem qualquer componente palustre, sobretudo em locais com profundidades inferiores a
0.25 m. De acordo com este modelo, verifica-se uma forte interacção entre a variável tipo
de habitat e as características associadas ao meio aquático; ou seja, em diferentes habitats
actuam diferentes factores na abundância, de forma mais ou menos complexa.
Segundo o modelo que entra em consideração apenas com as variáveis associadas
directamente às características dos meios aquáticos, a profundidade é o parâmetro mais
importante na presença desta espécie (ausente para profundidades inferiores a 0.25 m).
Para os locais onde a espécie ocorre, os factores mais importantes na abundância são a
cobertura de vegetação emergente e imersa. As maiores abundâncias verificam-se para
valores simultaneamente elevados destes factores.
A preferência por locais com maior cobertura de vegetação deve-se provavelmente
ao facto de constituir uma importante componente alimentar (Sidis & Gasith, 1985), de
albergar uma maior concentração de fauna aquática consumida por esta espécie e de
desempenhar um papel importante como abrigo. O maior grau de cobertura de vegetação
aquática pode também estar correlacionado com menores velocidades da corrente, que
dificultam a sua movimentação na água.
Para ambos os modelos, tanto do ponto de vista do produtor como do utilizador
verificou-se um número maior de trocas entre os níveis de abundância ausência e média e
entre os níveis média e alta do que entre os níveis ausência e alta. Apesar dos modelos
baseados em árvores de classificação não pressuporem à partida a existência de um
102
4. Discussão
gradiente entre as classes da variável resposta, este resultado sugere um padrão contínuo da
abundância ao longo de um gradiente ambiental.
Emys orbicularis
Esta espécie foi encontrada em todos as categorias de habitat aquático consideradas neste
trabalho, excepto em habitats de carácter lacustre, como por exemplo albufeiras. Alguns
dados estão de acordo com os modelos de distribuição, como é o caso da maior frequência
de presença em locais de menor altitude do que Mle. Um dado curioso é o facto da sua
presença ser mais frequente em locais onde se verificam maiores densidades de Mle. Isto
significa que as exigências ecológicas das duas espécies ao nível do habitat são muito
semelhantes, mas que Eor tende a não ocupar os habitats menos propícios. Este facto pode
ser mais um indício da sua regressão em Portugal, uma vez que, como já foi referido, as
populações sujeitas a uma grande fragmentação tendem a ocupar apenas os habitats de
melhor qualidade.
103
5. Considerações finais
5. CONSIDERAÇÕES FINAIS
Os resultados obtidos neste trabalho mostram que ambas as espécies de cágados
apresentam uma distribuição predominantemente mediterrânea em Portugal. Entre as
variáveis macro-ambientais disponíveis, a radiação solar é aquela que parece ter maior
influência na distribuição de ambas as espécies à escala geográfica. À escala local ambas
as espécies preferem habitats aquáticos de águas paradas, baixa profundidade e com uma
cobertura razoável de vegetação aquática. Para Emys orbicularis essa preferência parece
ser ainda mais marcada do que para Mauremys leprosa.
A distribuição de Emys orbicularis em Portugal contrasta com o seu padrão global
de distribuição; na Europa Emys orbicularis apresenta uma distribuição mais setentrional
do que Mauremys leprosa, estando à partida melhor adaptada a climas mais frios. A maior
frequência desta espécie no sul do país pode dever-se a uma maior disponibilidade de
habitats favoráveis nesta região. Por outro lado, se as suas populações estão em regressão,
a preferência por habitats favoráveis torna-se ainda mais vincada; é o que, de resto,
sugerem os resultados das análises efectuadas a nível local.
As metodologias empregues neste trabalho mostraram ser eficazes na modelação da
distribuição em Portugal das duas espécies de cágados. A regressão logística originou
modelos mais realistas, embora com uma interpretação bastante mais complexa do que as
árvores de classificação. No entanto, as medidas de precisão total dos modelos resultaram
muito semelhantes ou mesmo iguais.
Uma hipótese a considerar futuramente seria a de modelar a distribuição com base
no grau de isolamento de cada quadrícula de presença (utilizando por exemplo o índice de
raridade local - ver pág. 14), entendido como uma medida grosseira da abundância da
espécie. A “zona de confusão” seria certamente mais bem modelada resultando numa
maior precisão de classificação. A regressão logística ordinal e as árvores de regressão ou
classificação constituem dois métodos possíveis para a modelação de variáveis resposta
quantitativas.
Por outro lado, as árvores de classificação revelaram-se bastante úteis na análise
exploratória da influência de variáveis locais na abundância de Mauremys leprosa,
sobretudo atendendo às óbvias limitações da recolha dos dados, que impossibilitaram um
tratamento estatístico mais aprofundado.
105
5. Considerações finais
Os resultados obtidos com este trabalho reflectem razoavelmente bem o estado das
populações a nível nacional das duas espécies. Não se possuem dados históricos
suficientemente precisos para fundamentar uma eventual regressão de Emys orbicularis em
Portugal, embora a sua elevada fragmentação da distribuição e o seu declínio global em
toda a Europa constituam fortes indícios.
A situação das populações de Emys orbicularis em Portugal, comparativamente às
de Mauremys leprosa, nomeadamente em relação à sua raridade e às baixas densidades
observadas, podem ser o resultado de muitos factores, tais como: (1) o resultado da
ocorrência de flutuações naturais das populações, nomeadamente devido a factores
climáticos; (2) fenómenos de competição com Mauremys leprosa; (3) factores intrínsecos à
própria estratégia demográfica da espécie; (4) maior vulnerabilidade desta espécie à
alteração dos habitats e a agentes poluidores; (5) Portugal constituir o limite de distribuição
da espécie, sendo natural a fragmentação observada; (6) a conjugação de todos os factores
atrás mencionados. Apenas estudos mais aprofundados e comparativos da demografia,
genética de populações e biogeografia desta espécie poderão fornecer pistas nesse sentido.
Os dados obtidos com este trabalho, tais como a probabilidade de ocorrência, o
grau de fragmentação, o isolamento das populações e a coexistência das duas espécies,
complementadas com informações sobre a distribuição geográfica do grau de adequação
dos habitats e da abundância, serão úteis para a selecção de áreas prioritárias para a
conservação destas espécies a nível nacional.
106
6. Referências
6. REFERÊNCIAS Amo, O. A. (1991). Estatus y distribuicion del galapago europeu (Emys orbicularis) en
Cataluña. VIII Trabada JuvesNat. Catalunya. 35-39. Araújo, P. R., Segurado, P., & Raimundo, N. (1997). Bases para a conservação das
tartarugas de água doce, Mauremys leprosa e Emys orbicularis. Estudos de Biologia e Conservação da Natureza, 24. Instituto da Conservação da Natureza, Lisboa.
Astudillo, G., & Arano B. (1995). Europa y su Herpetofauna: responsabilidades de cada
pais en lo referente a su conservacion. Bol. Aso. Herpetol. Esp. 6, 14-45 Andries, A.M., Gulinck, H., & Herremans, M. (1994). Spatial modelling of the barn owl
Tyto alba habitat using landscape characteristics derived from SPOT data. Ecography, 17, 278-287.
Antunez, A., & Mendoza, M. (1992). Factores que determinan el área de distribución
geográfica de las espécies: conceptos, modelos y métodos de análisis. In J.M. Vargas, R. Real, & A. Antúnez (Eds.), Objectivos y Métodos Biogeográficos. Aplicaciones en Herpetologia. (pp. 51-72). A.H.E, Madrid.
Anselin, L. (1993). Discrete space autoregressive models. In Goodchild, M.F., Parks, B.O.
& Steyaert, L.T.New (Eds) Environmental Modeling with GIS (pp. 454-469), Oxford University Press, York.
Arnold, E.N., Burton, J.A., & Ovenden, D.W. (1978). A Field Guide to the Reptiles and
Amphibians of Britain and Europe. Collins, London. Aspinall, R., & Veitch, N. (1993). Habitat Mapping from Satelite Imagery and Wildlife
Survey Data Using a Bayesian Modeling Procedure in a GIS. Photogrammetric Engineering & Remote Sensing, 59, 537-543.
Augustin, N.H., Mugglestone, M.A., & Buckland, S.T. (1996). An autologistic model for
the spatial distribution of wildlife. Journal of Applied Ecology, 33, 339-347. Austin, G.E., Thomas, C.J., Houston, D.C., & Thompson, B.A. (1996). Predicting the
spatial distribution of buzzard Buteo buteo nesting areas using Geographical Information System and remote sensing. Journal of Applied Ecology, 33, 1541-1550.
Barbadillo, L.J. (1987). La Guia de INCAFO de los Anfibios Y Reptiles de la Peninsula
Iberica, Islas Baleares y Canarias. INCAFO, Madrid Begon, M., Harper, J.L., & Townsend, C.R. (1996). Ecology. Blackwell Science, Oxford.
107
6. Referências
Berry, J.K. (1993). Cartographic modeling: the analytical capabilities of GIS. In M.F. Goodchild, B.O. Parks, & L.T. Steyaert (Eds.), Environmental Modeling with GIS. (pp. 58-74). Oxford University Press, New York.
Bons, J., & Geniez, P. (1996). Amphibiens et Reptiles du Maroc. Atlas biogeographique.
Asociación Herpetológica Española, Barcelona. Boscá, E. (1881). Catalogue des reptiles et amphibiens de la Peninsule Iberique et des iles
Baléares. Bulletin de la Societé Zoologuique de France: 1-47. Breininger, D.R., Provancha, M.J., & Smith, R.B. (1991). Mapping Florida Scrub Jay
Habitat for Purposes of Land-Use Management. Photogrammetric Engineering & Remote Sensing, 57, 1467-1474.
Brito, J.C., Abreu, F.B., Paulo, O.S., Rosa, H.D., & Crespo, E.G. (1996). Distribution of
Schreiber's lizard (Lacerta Shreiberi) in Portugal: a predictive model. Herpetolical Journal, 6, 43-47.
Brito, J.C., Crespo, E.G., & Paulo, O.S. (1999). Modelling wildlife distributions: logistic
multiple regression vs. overlap analisys. Ecography, 22, 251-260. Brown, J.H., & Gibson, A.C. (1983). Biogeography. Mosby, St Louis. Buckland, S.T., & Elston, D.A. (1993). Empirical models for the spatial distribution of
wildlife. Journal of Applied Ecology, 30, 478-495. Chandler, S.K., Fraser, J.D., Buehler, D.A., & Seegar, J.K.D. (1995). Perch trees and
shoreline development as predictors of bald eagle distribution on Chesapeake Bay. Journal of Wildlife Management, 59, 325-332.
C.N.A. (1983). Atlas do Ambiente. Direcção-Geral do Ambiente. Ministério do Ambiente e
dos Recursos Naturais, Lisboa. Clark, J.D., Dunn, J.E., & Smith, K.G. (1993). A multivariate model of female black bear
habitat use for a geographic information system. Journal of Wildlife Management, 57, 519-526.
Clark L.A., Pregibon, D. (1992). Tree-based Models. in Statistical Models in S. Chambers,
J. M., Hastie, T. J. (eds.). Chapman and Hall, New York. Cliff, A.D. & Ord, J.K. (1998). Spatial autocorrelation, Pion Limited, London. Congalton, R.C. (1991). A review of assessing the accuracy of classification of remotely
sensed data. Remote Sens. Environ. 37, 35-46. Corbett, K. (1989). Conservation of European Reptiles & Amphibians. Cristopher Helm
Ltd, London. Cox, C.B., & Moore, P.D. (2000). Biogeography. An Ecological and evolutionary
temperature and basking behavior of the turtle Pseudemys scripta. Ecology 64(5), 989-999.
Crespo, E.G., & Oliveira, M.E. (1989). Atlas da Distribuição dos Anfíbios e Répteis de
Portugal Continental. Lisboa: S.N.P.R.C.N. Da Silva, E. (1991). Contribucion al conocimiento de la biologia reproductora y dinamica
del crescimento oseo de Mauremys caspica leprosa (Schw. 1812). Resumo da Tese de Doutoramento, Universidade de Extremadura, badajoz.
Eastman, J.R. (1990). IDRISI: AGrid-Based Geographic Information System. Version 3.2.
(Worcester, MA: Clark University Graduate School of Geography) EGRET. (1991). EGRET: Statistical Analysis Package. Seattle: Statistics and
Epidiomological Research Corporation. Ellison, A.M. (1996). An introduction to bayesian inference for ecological research and
environmental decision-making. Ecological Applications, 6, 1036-1046. Ernst, C.H., & Barbour, R.W. (1989). Turtles of the world. Smithsonian Institution Press,
Washington, D.C. Farinha, J.C., Costa, L.T., Zalidis, G., Mantzavelas, A., Fitoka, E., Hecker, N. & Tomàs
Vives, P. (1996). Mediterranean Wetland Inventory: Habitat Description System..Medwet / Instituto da Conservação da Natureza (ICN) / Wetlands International / Greek Biotope/Wetland Centre (EKBY) Publication.Volume III.
Forman, R.T.T. (1995). Land Mosaics. Cambridge University Press, Cambridge. Franklin, J. (1998). Predicting the distribution of shrub species in southern California from
climate and terrain-derived variables. Journal of Vegetation Science, 9, 733-748. Frisenda, S.,& Ballasina, D. (1990). Le Statut des Chéloniens Terrestres et d´Eau Douce en
Italie. Bull. Soc. Herp. Fr. 53,:18-23 Gaston, K.J., & Lawton, J.H. (1990). Effects of scale and habitat on the relationship
between regional distribution and local abundance. Oikos, 58, 329-335. Gates, S., Gibbons, D.W., Lack, P.C., & Fuller, R.J. (1994). Declining farmland bird
species: modelling geographical patterns of abundance in Britain. In P.J. Edwards, R.M. May, & N.R. Webb (Eds.), Large-scale ecology and conservation biology. (pp. 153-177). Blackwell Scientific Publications, London.
Gilpin, M.E. (1987). Spatial structure and population vulnerability. In M.E. Soulé (Ed.),
Viable Populations for Conservation. (pp. 125-139). Cambridge Uinversity Press, Cambridge
109
6. Referências
Hanski, I. (1996). Metapopulation ecology. In O.E. Rhodes, Jr (Ed.), Population dynamics in ecological space and time. (pp. 13-43). University of Chicago Press, Chicago.
Hanski, I., & Gilpin, M.E. (1991). Metapopulation dynamics: brief history and conceptual
domain. Biological Journal of the Linnean Society, 42, 3-16. Harding, P.T. (1991). National species distribution surveys. In F.B. Goldsmith (Ed.),
Monitoring for conservation and ecology. (pp. 133-154). Chapman & Hall, London.
Harrison, S. (1994). Metapopulations and conservation. In P.J. Edwards, R.M. May, &
Haslett, J.R. (1990). Geographic information systems: a new approach to habitat definition
and the study of distributions. TREE, 5, 214-218. Heatwole, H., & Taylor, J. (1987). Ecology of Reptiles. Surrey Beatty & Sons, Shipping
Norton. Hill, M.O. (1991). Patterns of species distribution in Britain elucidated by canonical
correspondence analysis. Journal of Biogeography, 18, 247-255. Hoef, J.M.V. (1996). Parametric empirical bayes methods for ecological applications.
Ecological Applications, 6(4), 1047-1055. Hosmer Jr, D.W. & Lemeshow, S. (1989). Applied Logistic Regression. Wiley, New York. Iverson, L.R. & Prasad, A.M. (1998). Predicting abundance of 80 tree species following
climate change in the Eastern United States. Ecological Monographs, 68(4), 465-485.
Johnston, C.A. (1998). Geographic Information Systems in Ecology. Blackwell Science,
Oxford. Keller, C., Díaz-Paniagua C.,& Andreu A.C. (1994). Distribución de Mauremys leprosa y
Emys orbicularis en Doñana (SO de España). III Congresso Luso-español, VII Congresso Español, Badajoz.
Kvamme, K.L. (1990). The fundamental principles and practice of predictive
archaeological modeling. In A. Voorrips (Ed.), Mathematics and information science in archaeology: a flexible framework. (pp. 257-295). Holos-Verlag, Bonn.
Kvamme, K.L. (1992). A predictive site location model on the high plains: an example
and processes. In P.J. Edwards, R.M. May, & N.R. Webb (Eds.), Large-scale
110
6. Referências
ecology and conservation biology. (pp. 41-58). Blackwell Scientific Publications, London.
Malkmus R. (1995). Die Amphibien und Reptilien Portugals, Madeiras und Der Azoren.
Westarp Wissenschaften, Magdeburg. 105-109. Maurer, B.A. (1994). Geographical Population Analysis: Tools for the Analysis of
Biodiversity. Blackwell Science, Oxford. May, R.M. (1994). The effects of spatial scale on ecological questions and answers. In P.J.
Edwards, R.M. May, & N.R. Webb (Eds.), Large-scale ecology and conservation biology. (pp. 1-17). Blackwell Scientific Publications, London.
McCullagh, P. & Nelder, J.A. (1989). Generalized Linear Models. Chapman & Hall. MicroImages (1997). The Map and Image Processing System version 5.7. Lincoln, USA. Murphy, D.D. (1989). Conservation and confusion: Wrong species, wrong scale, wrong
conclusions. Conservation Biology, 3 (1), 82-84. Nečas, P.; Modrý, D; Zavadil, V (1997). Czech Recent and Fossil Amphibians and
Palmeirim, J.M. (1985). Using Landsat TM Imagery and Spatial Modeling in Automatic
Habitat Evaluation and Release Site Selection for the Ruffed Grouse (Gallifomes: Tetraonidae). Proceedings 19th International Symposium of Remote Sensing and Environment.
Parker, S. (1985). Predictive modeling of site settlement systems using multivariate
logistics. In C. Carr (Ed.), For concordance in archaeological analysis. (pp. 173-207). Westport, Kansas City.
Pereira, J.M.C., & Duckstein, L. (1993). A multiple criteria decision-making approach to
GIS-based land suitability evaluation. Int J Gographical Information Systems, 7, 407-424.
Multiple Regression: A Study of the Mt. Graham Red Squirrel. Photogrammetric Engineering & Remote Sensing, 57, 1475-1486.
Rapoport, E.H. (1982). Aerography. Geographical strategies of species. Pergamon Press,
Oxford.
111
6. Referências
Rogers, D.J., & Williams, B.G. (1994). Tsetse distribution in Africa: seeing the wood and
the trees. In P.J. Edwards, R.M. May, & N.R. Webb (Eds.), Large-scale ecology and conservation biology. (pp. 247-271). Blackwell Scientific Publications, London.
Romero, J., & Real, R. (1996). Macroenvironmenteal factors as ultimate determinants of
distribution of common toad and natterjack toad in the south of Spain. Ecography, 19, 305-312.
Segurado, P. (1996). Estudo da estrutura das populações e de alguns parâmetros
demográficos de Mauremys leprosa e de Emys orbicularis em Portugal. Actas do IV Congresso Luso-Espanhol, VII Congresso Espanhol de Herpetologia. Porto.
Servan J., & Pieau C. (1984). La cistude d'Europe (Emys orbicularis): Mensuration d'oeufs
et de jeunes individus.Bull. Soc. Herp. Fr. 1984, 31:20-26 S.N.P.R.C.N.(ed.). (1990). Livro Vermelho dos Vertebrados de Portugal. Vol. I -
Mamíferos, Aves, Répteis e Anfíbios. Lisboa: S.N.P.R.C.N. Sidis, I & Gasith, A. (1985). Food Habits of the Caspian Terrapin (Mauremys caspica
rivulata) in Unpolluted and Polluted Habitats in Israel. Journal of Herpetology. 19 (1), 108-115.
Spellerberg, I.F. (1982). Biology of Reptiles. An ecological approach. Blackie & Son Ltd,
London. Spellerberg, I.F. (1992). Evaluation and assessment for conservation Chapman & Hall,
London. Statistical Sciences (1995). S-PLUS Guide to Statistical and Mathematical Analysis,
Version 3.3.StatSci, MathSoft, Inc., Seatle. Teixeira, J., Arntzen, J.W., Ferrand, N., & Alexandrino, J. (1996). Elaboração de um
modelo preditivo da distribuição de Chioglossa lusitanica em Portugal. Actas do IV Congresso Luso-Espanhol, VII Congresso Espanhol de Herpetologia. Porto.
1637. Vernaples W. N., & Ripley, B. D. (1997). Modern Applied Statistics with S-PLUS.
Springer-Verlag, New York. Walker, P.A. (1990). Modelling wildlife distributions using a geographic information
system: Kangaroos in relation to climate. Journal of Biogeography, 17, 279-289. Warren, R.E. (1990). Predictive modelling in archaeology: a primer. In K.M.S. Allen, S.W.
Green, & E.B.W. Zubrow (Eds.), Interpreting space: GIS and archaeology. (pp. 90-111). Taylor & Francis, London.
112
6. Referências
Zar, J.H. (1984). Biostatistical analysis. Prentice-Hall, New Jersey.