-
UNIVERSIDADE ESTADUAL DO OESTE DO PARAN - UNIOESTE
CENTRO DE CINCIAS EXATAS E TECNOLGICAS
PROGRAMA DE PS-GRADUAO EM ENGENHARIA AGRCOLA
ESTATSTICA ESPACIAL APLICADA AGRICULTURA DE
PRECISO
GUSTAVO HENRIQUE DALPOSSO
CASCAVEL - PR
Janeiro 2010
-
GUSTAVO HENRIQUE DALPOSSO
ESTATSTICA ESPACIAL APLICADA AGRICULTURA DE
PRECISO
Dissertao apresentada ao Programa de Ps-
Graduao em Engenharia Agrcola, em
cumprimento parcial aos requisitos para obteno
do ttulo de Mestre em Engenharia Agrcola, pela
UNIOESTE/Campus de Cascavel, rea de
concentrao Engenharia de Sistemas
Agroindustriais.
Orientador: Professor Dr. Miguel Angel Uribe
Opazo
Co-orientador: Professor Dr. Erivelto Mercante
CASCAVEL
Janeiro - 2010
-
Dalposso, Gustavo Henrique D149 Estatstica espacial aplicada
agricultura de preciso. /
Gustavo Henrique Dalposso. Cascavel, 2010. 66 f.
Orientador: Prof. Dr. Miguel Angel Uribe Opazo.
Dissertao(Mestrado) Universidade Estadual do Oeste do Paran.
1. Estatstica Aplicada - Agricultura. 2. Geoestatistica . 3.
Estatstica Espacial. 4. ndice de Moran. I. Opazo, Miguel Angel
Uribe. II. Ttulo.
CDD 519.5 Ficha Catalogrfica Biblioteca do Campus Cascavel
-
DEDICO
A Henrique Luis
-
AGRADECIMENTOS
Ao meu orientador Dr. Miguel Angel Uribe Opazo que me conduziu
neste trabalho e
proporcionou o meu desenvolvimento no Programa de Ps-graduao e
por ser um grande amigo e
profissional.
Ao meu co-orientador Dr. Erivelto Mercante pela parceria
firmada, pois esta alm de render
diversos trabalhos, rendeu uma grande amizade.
Ao meu amigo professor Jerry Adriani Johann, pelos trabalhos
desenvolvidos no LEA, pois
estes fizeram parte de minha formao.
A todos os pesquisadores do grupo GGEA, pela oportunidade
oferecida.
Ao Programa de Ps-graduao em Engenharia Agrcola e a todos os
professores do curso.
CAPES pela bolsa concedida.
-
SUMRIO LISTA DE TABELAS
.........................................................................
viii
LISTA DE FIGURAS
..........................................................................
ix
LISTA DE SMBOLOS
.......................................................................
x
RESUMO
.............................................................................................
xii
ABSTRACT
.........................................................................................
xiii
1 INTRODUO
..................................................................................
1
2 GEOESTATSTICA APLICADA AGRICULTURA DE PRECISO
.........................................................................................
2
2.1 INTRODUO
....................................................................................
2
2.2 REVISO BIBLIOGRFICA
............................................................. 4
2.2.1 Evoluo da geoestatstica
....................................................................
4
2.2.2 Hipteses e caractersticas importantes
................................................ 4
2.2.3 Modelo geoestatstico
...........................................................................
6
2.2.4 Parmetros da estrutura de dependncia espacial
................................. 8
2.2.5 Modelagem da estrutura de dependncia espacial
................................ 10
2.2.6 Estimao de parmetros
......................................................................
13
2.2.7 Estimador linear geoestatstico: Krigagem
........................................... 15
2.2.8 Validao cruzada
................................................................................
16
2.2.9 Influncia local
.....................................................................................
18
2.2.10 Acurcia em mapas temticos
..............................................................
19
2.2.11 Modelagem cartogrfica
.......................................................................
24
2.3 MATERIAL E MTODOS
..................................................................
25
2.3.1 Material
.................................................................................................
25
2.3.2 Metodologia
..........................................................................................
25
2.4 RESULTADOS E DISCUSSO
......................................................... 29
2.5 CONCLUSO
......................................................................................
42
-
2.6 REFERNCIAS
...................................................................................
43
3 ESTATSTICA DE REAS APLICADA AGRCULTURA DE PRECISO
...................................................................................
46
3.1 INTRODUO
....................................................................................
46
3.2 ANLISE DE DADOS DE REAS
................................................... 47
3.2.1 Anlise exploratria
..............................................................................
47
3.2.2 Elementos bsicos
................................................................................
47
3.2.3 Indicador global de autocorrelao espacial
......................................... 49
3.2.4 Diagrama de espalhamento de Moran
.................................................. 50
3.2.5 Mapa de espalhamento de Moran
......................................................... 51
3.2.6 ndice local de associao espacial (LISA)
........................................... 52
3.2.7 Lisa map
...............................................................................................
52
3.2.8 Moran map
............................................................................................
53
3.3 MATERIAL E MTODOS
..................................................................
54
3.3.1 Material
.................................................................................................
54
3.3.2 Metodologia
..........................................................................................
55
3.4 RESULTADOS E DISCUSSO
......................................................... 56
3.5 CONCLUSO
......................................................................................
65
3.6 REFERNCIAS
...................................................................................
66
-
LISTA DE TABELAS
Tabela 1 Matriz dos erros genrica de ordem k x k
............................................. 18 Tabela 2 Matriz de
confuso da k-sima classe
.................................................. 20
Tabela 3 Mtricas derivadas da matriz de confuso por classe
........................... 21 Tabela 4 Matriz de confuso total
.......................................................................
21 Tabela 5 Mtricas derivadas da matriz de confuso total
................................... 22 Tabela 6 Parmetros do
semivariograma omnidirecional ...................................
30
Tabela 7 Modelos ajustados e parmetros obtidos do conjunto
amostral completo da produtividade de trigo [t ha-1]
..........................................
31
Tabela 8 Validao cruzada para a produtividade de trigo [t ha-1]
relativa a todo o conjunto amostral
......................................................................
31
Tabela 9 Modelos ajustados e parmetros do conjunto amostral da
produtividade de trigo [t ha-1] sem as amostras influentes
...................
33
Tabela 10 Validao cruzada para a produtividade de trigo [t ha-1]
sem as amostras influentes
...............................................................................
34
Tabela 11 Matriz dos erros dos pixels mapas de produtividade de
trigo .............. 36 Tabela 12 Produo estimada em cada classe da
legenda ..................................... 36 Tabela 13 ndices
de acurcia de usurio (AU) e produtor (AP)
.......................... 37 Tabela 14 Estatsticas do ndice Kappa
( K ) ................................................... 37 Tabela
15 Elementos (pixels) da matriz de confuso da classe Ck
....................... 37 Tabela 16 Mtricas obtidas das matrizes
de confuso de cada classe ................... 38 Tabela 17 Matriz
de confuso total da produtividade de trigo
.............................. 38 Tabela 18 ndice I de Moran dos
ndices NDVI e GVI ......................................... 55
Tabela 19 Porcentagens de municpios em cada quadrante do grfico
de espalhamento de Moran dos ndices NDVI e GVI
............................... 57
Tabela 20 ndice local de associao espacial (LISA) do ndice NDVI
............... 58 Tabela 21 ndice local de associao espacial
(LISA) do ndice GVI .................. 59
-
LISTA DE FIGURAS
Figura 1 Funes covarincia e variograma
....................................................... 8
Figura 2 (A) Localizao dos 50 pontos amostrais e (B) Diviso da
rea em talhes
...................................................................................................
23
Figura 3 Roteiro da anlise geoestatstica
........................................................... 26
Figura 4 Grfico boxcox da produtividade de trigo
............................................ 27
Figura 5 Grfico espacial da produtividade de trigo
................................. 27 Figura 6 Grfico boxplot da
produtividade de soja ................................... 28 Figura
7 Grfico das coordenada versus produtividade de trigo
............... 28
Figura 8 Semivariogramas direcionais da produtividade de trigo
............. 29 Figura 9 Semivariograma experimental da
produtividade de trigo .................... 29 Figura 10 Envelopes
simulados
............................................................................
30
Figura 11 (A) Grfico de diagnstico |Lmax|; (B) Localizao dos
pontos influentes na rea monitorada
...............................................................
32
Figura 12 Semivariograma experimental construdo sem os pontos
influentes ... 33
Figura 13 Semivariogramas ajustado: (A) completo e (B) sem os
pontos influentes
..............................................................................................
34
Figura 14 (A) Mapa temtico da produtividade de trigo utilizando
50 elementos amostrais na interpolao e (B) Mapa temtico da
produtividade de trigo utilizando 48 elementos amostrais na
interpolao......................
35 Figura 15 Mapa da diferena de produtividade em mdulo entre os
dois mapas . 35 Figura 16 Representao dos tipos de contiguidade
entre reas. (A)
Contiguidade Queen rainha, (B) Contiguidade Rook torre e (C)
Contiguidade Bishop
bispo................................................................
47
Figura 17 Construo do grfico de disperso do ndice I de Moran
................... 49 Figura 18 Legenda do mapa de espalhamento de
Moran ..................................... 50
Figura 19 Shapefile dos 36 municpios estudados na Regio Oeste do
Paran
..........................................................................................
52
Figura 20 Roteiro de anlise que ser trabalhado com ndices de
vegetao ....... 53 Figura 21 Evoluo temporal do ndice NDVI
..................................................... 54 Figura 22
Evoluo temporal do ndice GVI
........................................................ 55
Figura 23 Diagrama de espalhamento de Moran (Moran Scatterplot)
para os ndices NDVI e GVI em 23/11/2004, 25/12/2004 e 11/02/2005
.......... 56
Figura 24 Mapa de significncia LISA do ndice de vegetao NDVI da
soja .... 60 Figura 25 Mapa de significncia LISA do ndice de
vegetao GVI da soja ....... 61 Figura 26 LISA cluster map do ndice
NDVI da soja na safra 2004/2005............ 61
-
LISTA DE SMBOLOS Captulo 2
)(sZ Valor do atributo na localizao s
)( hsZ + Valor do atributo na localizao s + h C(h) Funo de
covarincia Mdia
d Espao euclidiano d-dimensional (d 1)
Matriz de covarincia (s) Modelo espacial linear
i Parmetros desconhecidos a serem estimados 1 Efeito pepita ou
erro de varincia
2 Contribuio ou varincia de disperso a Alcance ou raio de
dependncia espacial
3 Funo do alcance R Matriz que funo de 3 In Matriz identidade de
ordem n
)(h Funo semivarincia C Patamar
Vetor de parmetros. OLS Mnimos quadrados ordinrios WLS1 Mnimos
quadrados ponderados ML Mxima verossimilhana RML Mxima
verossimilhana restrita
)(L Funo de verossimilhana
l ( ) Funo log-verossimilhana EM Erro mdio
)( )(isZ Representa o valor predito por krigagem ordinria no
ponto is , sem considerar a observao )( isZ .
ER Erro mdio reduzido )( )(is Desvio padro da krigagem no ponto
is , sem considerar a observao )( isZ
DPEM Desvio padro do erro mdio SER Desvio padro dos erros
reduzidos EA Erro absoluto
Vetor de perturbao das respostas
-
0 Ponto de no perturbao LD() Afastamento da verossimilhana EG
Exatido global Ck Classe k do mapa temtico AU Acurcia de usurio AP
Acurcia de produtor
K ndice Kappa
2 Varincia T ndice Tau S ndice de sensibilidade E ndice de
especificidade TFPk Taxa de falso positivo TFNk Taxa de falso
negativo CCM Coeficiente de correlao de Matthews E Efeito pepita
relativo
Captulo 3
W Matriz de proximidade espacial Z Vetor dos desvios Wz Vetor de
mdias ponderadas I ndice de Moran Global x Mdia dos atributos
iI ndice LISA 2 varincia da distribuio dos valores dos
desvios
-
RESUMO
As metodologias fornecidas pela estatstica espacial so de grande
importncia para estudos envolvendo dados relacionados agricultura,
pois permitem conhecer a variabilidade espacial dos atributos
estudados e identificar regies que apresentam caractersticas
semelhantes, o que permite realizar tratamentos localizados,
maximizando as produtividades e minimizando os impactos causados
pela aplicao de insumos em excesso. Um dos ramos da estatstica
espacial a geoestatstica, que utiliza um conjunto de variveis
regionalizadas para modelar a estrutura de dependncia espacial,
possibilitando a elaborao de mapas temticos. Atualmente os estudos
geoestatsticos no terminam com a elaborao dos mapas, pois alm de
estimar o atributo monitorado em locais no amostrados se faz
necessrio investigar a qualidade destes mapas, investigando pontos
influentes e utilizando medidas que permitam comparar mapas e
realizar estimaes de reas. Outra forma de investigao conhecida como
estatstica espacial de reas, em que os objetos de anlise so
polgonos que representam talhes, bairros, municpios, estados entre
outros. Neste tipo de anlise, procura-se identificar autocorrelaes
espaciais em nvel global e local, e a forma usual de apresentao dos
resultados feita utilizando mapas temticos. Neste trabalho
utilizou-se a geoestatstica para investigar a produtividade de
trigo em uma rea agrcola de 13,7 hectares no municpio de Salto do
Lontra Pr. Das 50 amostras coletadas, identificou-se duas como
influentes e, com isso, optou-se por construir dois mapas temticos
e compar-los utilizando mtricas derivadas da matriz dos erros. Os
resultados mostraram que os mapas so diferentes e a retirada dos
pontos influentes foi de fundamental importncia para melhorar a
qualidade do mapa temtico, visto que a diferena entre a
produtividade estimada e a produtividade real foi de apenas 40
quilos. Para apresentar os recursos fornecidos pela estatstica
espacial de reas comparou-se os ndices de vegetao NDVI e GVI da
produtividade de soja de 36 municpios da regio Oeste do Paran no
ano agrcola 2004/2005. Os resultados permitiram identificar regies
com caractersticas semelhantes e que a soja cultivada em perodos
distintos na regio.
Palavras-chave: matriz dos erros, ndice I de Moran, matriz de
contiguidade
-
SPATIAL STATISTICS APPLIED TO PRECISION AGRICULTURE
ABSTRACT
The methods provided by the spatial statistics are of great
importance for studies involving data related to agriculture, for
they allow one to know the space variability of the study and
identify regions that have similar characteristics, which allows
completely localized treatment, maximizing productivity and
minimizing the impacts of excessive input application.
One of the branches of spatial statistics is geostatistics,
which uses a set of regionalized variables to model the structure
of spatial dependence, allowing the preparation of thematic maps.
Currently, geostatistical studies do not end with the preparation
of maps, but also estimates monitored the attribute in non-sampled
locations. It is necessary to investigate the quality of these
maps, investigating influential points and using measurements to
compare maps and area estimations.
Another form of research is known as spatial statistics of areas
where the objects of analysis are polygons representing blocks,
neighborhoods, cities, states and others. This type of analysis
seeks to identify spatial autocorrelation in global and local
levels, and the usual form of reporting is through thematic
maps.
In this work we used geostatistics to investigate the
productivity of wheat in an agricultural area of 13.7 hectares in
the municipality of Salto do Lontra PR. Out of the 50 samples, two
were identified as influential, and thus, we chose to build two
thematic maps and to compare them using metrics derived from the
matrix of errors. The results showed that the maps are different
and the removal of influential points was essential to improve the
quality of thematic map, since the difference between the estimated
yield and actual yield was only 40 Kilos.
In order to display the resources provided by the spatial
statistics of areas we compared to the vegetation rates NDVI and
GVI's of soybean yield from 36 cities in Western Paran in the
agricultural year of 2004/2005. The results showed regions with
similar characteristics and that soybeans grow at different times
in the region.
Keywords: error matrix, Morans I Index, contiguity matrix
-
1 INTRODUO
A constante evoluo da informtica, no que diz respeito ao
desenvolvimento de softwares e hardwares, aliada ao crescimento da
cincia, em relao criao de novos mtodos de pesquisa, est mudando a
forma como o homem investiga a agricultura, e isso implica em
melhores condies de trabalho para o profissional do campo, que em
contrapartida, consegue oferecer produtos com melhor qualidade,
proporcionando uma melhor condio de vida para todos, e
principalmente, utilizando os recursos do meio ambiente
racionalmente. Esta prtica de investigao, que visa estabelecer
condies ideais as espcies cultivadas na agricultura, sejam elas
qumicas, fsicas ou biolgicas conhecida como agricultura de preciso
(AP). Segundo MOLIN (1997), a agricultura de preciso surge como uma
nova demanda de informtica na agricultura, pois implica na coleta e
manipulao de uma grande quantidade de dados que s podem ser
gerenciados por mtodos computacionais. Todo o embasamento dessa
nova tecnologia est na anlise da variabilidade espacial dos fatores
de produo, especialmente o solo. A partir dessa anlise as decises
devem ser tomadas para que se faa ento a aplicao dos insumos de uma
forma localizada e com dosagens precisas.
Entre os diversos mtodos utilizados para monitorar a
agricultura, destaca-se a estatstica espacial, termo este referente
aos mtodos estatsticos que incorporam nas anlises informaes sobre a
localizao, como as coordenadas geogrficas do ponto em que a amostra
foi coletada ou a localizao do polgono que representa a regio em
estudo. Dentro da estatstica espacial encontram-se diferentes
abordagens para anlise de dados georreferenciados, como por
exemplo, a geoestatstica e a estatstica espacial de reas.
A teoria das variveis regionalizadas, ou geoestatstica como mais
conhecida, uma cincia que teve seu inicio em investigaes realizadas
em minas de ouro na frica do Sul. Por meio de uma anlise
geoestatstica possvel estimar dados em locais no amostrados
analisando o comportamento espacial do fenmeno e minimizando o erro
da estimao.
O conjunto de recursos proporcionado pela anlise espacial em
unidades de reas muito importante dentro do universo de
possibilidades j disponibilizados em diversos Sistemas de Informao
Geogrfica. A apresentao dos resultados geralmente feita atravs de
mapas, que visam identificar regies com caractersticas semelhantes,
formando os conhecidos clusters. Nestes mapas, a variao do atributo
no espao no representada por uma superfcie contnua, como o caso da
geoestatstica, e sim por variaes abruptas de valores. Apesar de
limitadas s caractersticas de cada rea, muitas inferncias sobre
padres ou comportamentos espaciais dos diversos atributos podem ser
realizadas.
-
Neste contexto, o objetivo geral deste trabalho utilizar
recursos da estatstica espacial para investigar variveis vinculadas
agricultura.
2 GEOESTATSTICA APLICADA AGRICULTURA DE PRECISO
2.1 INTRODUO
O conjunto de atividades agrcolas, compreendendo a produo de
alimentos, fibras e energia, pode ser encarado como a alavanca da
economia brasileira, e isto de grande importncia, visto que muitos
pases desenvolvidos tm excesso de produo agrcola, sendo esta uma
das condies para se terem tornado ricos, pois o fato de serem
auto-suficientes na produo agrcola tem sido determinante para os
elevados nveis de prosperidade. Um fato que de certa forma barra o
crescimento da agricultura no Brasil que muitas reas agrcolas
comerciais, por trabalharem com produo em larga escala, so tratadas
como homogneas, o que acaba trazendo prejuzos para o produtor e
para o meio ambiente. Um exemplo a aplicao de fertilizantes
calculados com base em ndices mdios de fertilidade. Esta aplicao
feita de forma uniforme em toda a rea e, como conseqncia, reas com
maior nvel de fertilidade so adubadas em excesso e reas mais pobres
no so corrigidas. O mesmo ocorre na aplicao de agro qumicos no
combate de pragas e doenas, em que o tratamento uniforme gera
problemas de poluio em reas com baixos nveis de infestao. Uma soluo
eficaz para contornar este problema apresentada pela agricultura de
preciso por meio da geoestatstica, ramo da estatstica espacial que
permite estudar superfcies contnuas. A grande diferena em relao
estatstica tradicional que, por meio desta metodologia, alm do
valor do atributo no ponto em estudo, a sua localizao tambm
incorporada na anlise. Esse fato faz com que elementos amostrais
prximos tenham valores mais semelhantes e sejam mais
correlacionadas do que elementos amostrais mais distantes do ponto
estudado. Desta maneira, possvel realizar estimaes em locais no
amostrados, permitindo criar mapas temticos que descrevam o
comportamento do atributo que est sendo investigado na rea em
estudo. A geoestatstica fornece uma soluo para este tipo de
problema atravs do interpolador krigagem, nome dado em homenagem ao
engenheiro de minas Daniel Krige, pioneiro que, ao realizar
trabalhos com dados de minerao, concluiu que a variao destes
apresentava uma estruturao que dependia da distncia de amostragem
e, desta constatao, surgiram os conceitos bsicos de
geoestatstica.
-
Atualmente a geoestatstica encontra-se consolidada como cincia,
porm, sua evoluo contnua e dia aps dia surgem novas teorias,
mtodos, programas e ndices que ajudam o pesquisador a melhor
entender o comportamento do atributo na rea estudada.
-
2.2 REVISO BIBLIOGRFICA
2.2.1 Evoluo da geoestatstica
A geoestatstica tem por objetivo a caracterizao da disperso
espacial e espao-temporal das grandezas que definem a quantidade e
a qualidade de recursos naturais, tais como florestas, recursos
geolgicos, hidrolgicos, ecolgicos ou outros fenmenos espaciais em
que os atributos manifestam uma certa estrutura no espao e/ou no
tempo, como a contaminao de solos e aquferos, temperatura e
pluviometria de uma regio. O seu corpo metodolgico consiste
basicamente num conjunto de instrumentos estatsticos que
quantificam a continuidade espacial da grandeza em estudo, em
modelos de interpolao espacial tendo por base a sua variabilidade
estrutural (SOARES, 2000). A teoria das variveis regionalizadas
surgiu em meados de 1960 ligada escola francesa hoje conhecida como
Centre de Geoestatistique de Fontainebleau, fundada por Georges
Matheron. Ao estudar dados de concentrao de ouro em 1951 na frica
do Sul, o engenheiro de minas Daniel Krige concluiu que no
conseguia encontrar sentido nas varincias se no levasse em
considerao a distncia entre as amostras. Baseado nessa observao,
Matheron desenvolveu a teoria das variveis regionalizadas, que
contm os fundamentos da geoestatstica.
Segundo LADIM (2006), as variveis regionalizadas so constitudas
por um duplo aspecto contraditrio. Pela sua caracterstica aleatria
apresenta irregularidades e variao imprevisvel de um ponto para
outro e pela sua caracterstica estrutural apresenta relaes
existentes entre os pontos no espao motivadas pela sua gnese. Em
outras palavras, impossvel estimar com exatido o valor de um
atributo - por exemplo, a produtividade num determinado ponto da
rea agrcola (aspecto aleatrio) -, mas provvel que se encontre
produtividade elevada perto de locais com produtividade alta
(aspecto estrutural).
2.2.2 Hipteses e caractersticas importantes
Tem-se que uma varivel regionalizada uma funo numrica com
distribuio espacial, que varia de um ponto a outro com continuidade
aparente, mas cujas variaes no podem ser representadas por uma funo
simples, assim, para melhor compreenso dessa ferramenta, se faz
necessrio uma apresentao terica de algumas caractersticas
importantes.
a) Localizao
-
Os valores de uma varivel regionalizada so dependentes de suas
funes espaciais relativas dentro do campo geomtrico e, alm disso,
estes valores so dependentes do tamanho da amostra, de sua forma e
orientao (suporte amostral).
b) Continuidade
A continuidade espacial apresentada pela varivel regionalizada
entre amostras vizinhas reflete o grau de dependncia ou
independncia espacial entre as amostras. Espera-se que as amostras
mais prximas apresentem maior dependncia do que as que esto mais
distantes (CRESSIE, 1993). Dada uma caracterstica quantitativa )(sZ
, os diagramas de representao dos pares de pontos )(sZ vs )( hsZ +
, so algumas das estatsticas que contm informao mais rica sobre a
continuidade espacial de )(sZ . Quando a continuidade espacial no
identificada, diz-se que h presena de efeito pepita puro. Isto
indica um tipo extremo de comportamento do variograma prximo origem
e reflete a variao espacial de um fenmeno de transio onde para um
dado valor de patamar a amplitude ter um valor infinitesimalmente
menor que as distncias de observao (JOURNEL & HUIJBREGTS,
1978). Diante da presena do efeito pepita puro ressalta-se no se
deve utilizar o mtodo geoestatstico de interpolao.
c) Anisotropias
A anisotropia uma caracterstica muito frequente nos elementos da
natureza, isto , a variabilidade ou distribuio espacial de tais
elementos ocorre mais intensamente numa direo e menos intensamente
em outra direo. Quando a variabilidade espacial em uma rea
apresenta comportamento semelhante para distintas direes, dizemos
que os dados so isotrpicos. A isotropia de suma importncia para a
estimativa de locais no-amostrados. utilizada na construo de mapas
temticos de variabilidade, pois, por meio da identificao de que a
varivel analisada isotrpica, o estudo da dependncia espacial pode
ser feito por meio de um nico semivariograma, chamado de
omnidirecional (CARVALHO et al., 2008).
d) Estacionaridade
O conjunto de variveis aleatrias Z(si), i = 1,...,n, constituem
uma funo aleatria da qual s se conhece uma realizao z(si), ou seja,
o conjunto de dados amostrais.
Para estimar valores em locais no amostrados, deve-se introduzir
as restries de estacionaridade estatstica. A existncia de
estacionaridade permite que o experimento
-
possa ser repetido mesmo que as amostras sejam coletadas em
pontos diferentes, pois elas pertencem mesma populao com os mesmos
momentos estatsticos (VIEIRA, 2000). Uma funo aleatria considerada
estacionria quando o valor esperado para sua realizao o mesmo para
todos os pontos da rea em estudo, ou seja, E[Z(s1)] = E[Z(s2)]
=...= E[Z(si)] = . Este parmetro, que passa a ser independente da
localizao de si, pode ser estimado por uma mdia aritmtica dos
valores das realizaes das variveis aleatrias. Concretamente, a
hiptese de estacionaridade da mdia, ou de primeira ordem como
conhecida, implica que possa ser estimada pela mdia aritmtica das
observaes. Julgar esta hiptese de estacionaridade como apropriada
julgar a mdia das amostras como representativa da rea em
estudo.
Para a anlise geoestatstica necessrio tambm a estacionaridade de
segunda ordem, que implica que para cada par de uma varivel
aleatria, a funo de covarincia
)](),([)( hsZsZCovhC += existe e seja dependente da distncia h,
implicando na ocorrncia de varincia finita. Usualmente, a aceitao
de uma estacionaridade de segunda ordem no pode ser satisfeita.
Necessita-se ento de outro modelo estatstico, menos limitado, que
baseado na hiptese intrnseca, a qual considera apenas que a mdia
dos valores )(sZ e a varincia dos incrementos )()( hsZsZ + ocorrem
independentemente da localizao na regio, sendo funo apenas do valor
de h . Esta hiptese requer somente a hiptese de existncia do
semivariograma, sem a exigncia da varincia finita. Assim, a
varincia de )(sZ no finita, mas a varincia do primeiro incremento
de Z finita, e este incremento fracamente estacionrio (VIEIRA et
al., 1983). Assumida a estacionaridade, por meio da hiptese
intrnseca, e considerando que a associao das variveis em pontos
distintos maior medida que se reduz a distncia entre eles, o passo
seguinte descrever e modelar estas relaes entre distncias e
associao espacial.
2.2.3 Modelo geoestatstico
O fato dos modelos geoestatsticos incorporarem a incerteza na
sua formalizao no significa que o fenmeno em si tenha resultado de
um processo aleatrio, mas serve somente de base metodolgica
inferncia espacial ou estimao de grandezas em reas no amostradas e
quantificao da incerteza associada ao estimador (SOARES, 2000).
MARDIA & MARSHALL (1984) consideram um processo estocstico
gaussiano { }SssZ ii ),( , em que dS , sendo d espao euclidiano
d-dimensional (d 1). Ou seja, o processo TnsZsZZ ))(),...,(( 1= ,
em que is e us (i,u = 1,...,n) so localizaes espaciais conhecidas,
tm distribuio normal n-variada com vetor de mdias 1 e matriz de
-
covarincia , isto , Z ~ ),1( nN , em que uma constante; 1 um
vetor formado pelo algarismo 1 de ordem nx1 e uma matriz definida
positiva, de ordem n, dada por
[ ]))(),(( ui sZsZCov= . Supondo-se que os dados so descritos
pelo modelo da Equao (1):
)()()( iii sssZ += (1)
em que os termos determinstico )( is e estocstico )( is podem
depender da localizao espacial em que )( isZ foi obtida. Assume-se
que o erro estocstico tem mdia zero,
[ ] 0)( =isE , e que a variao entre pontos no espao determinada
por alguma funo de covarincia [ ])(),(),( uiui ssCovssC = .
Assume-se que para algumas funes conhecidas de s, como x1(s),
x2(s),...,xp(s), a mdia do processo estocstico dada pelo modelo
espacial linear apresentado na Equao (2):
=
=
p
u
uu sxs1
)()( (2)
em que p ,...,1 so parmetros desconhecidos a serem estimados. A
funo de covarincia ),( ui ssC tambm especificada por um vetor
q-dimensional
Tq ),...,( 1 = . Por simplicidade, pode-se utilizar as seguintes
notaes: ii zsZ =)( ,
TnzzZ ),...,( 1= , )( iuiu sxx = , Tipii xxx ),...,( 1= , em que
X uma matriz nxp com suas linhas
Tix ,
Tp ),...,( 1 = , )( ii s = , Tn ),...,( 1 = , com i = 1,...,n e
u = 1,...,p.
Desta forma, Tii xs =)( , e ento, i
Tii xz += (3)
De forma equivalente, em notao matricial, tem-se: += XZ
(4) Ento, 0)( =E e a matriz de covarincia de [ ])( iu= , em
que
).,( uiiu ssC= Assume-se que no singular e que X tem colunas com
posto completo. Considerando-se de maneira particular a forma
paramtrica da matriz de covarincia,
RI n 21 += (5)
-
em que:
1 : efeito pepita ou erro de varincia;
2 : contribuio ou varincia de disperso;
R: matriz que funo de 3 onde 3 funo do alcance (a) do modelo;
In: matriz identidade de ordem n.
A forma paramtrica da matriz de covarincia, dada na Equao 5,
ocorre para vrios processos isotrpicos, nos quais a covarincia ),(
ui ssC definida segundo a funo de covarincias iuiu rhC 2)( = , em
que uiiu ssh = a distncia euclidiana entre si e su. Nas funes de
covarincias )( iuhC , a varincia do processo estocstico Z
21)0( +=C . Assim, a funo variograma pode ser definida como:
)()0()( hCCh = (6)
Pela Equao (6), pode-se obter a funo covarincia:
)()0()( hChC = (7)
A covarincia C(h) e o variograma )(h so equivalentes para
caracterizar a dependncia espacial.
2.2.4 Parmetros da estrutura de dependncia espacial
Os parmetros fornecidos pela estrutura de dependncia espacial so
de grande importncia na anlise geoestatstica, pois so utilizados no
processo de krigagem, que o interpolador geoestatstico que cria o
mapa temtico do atributo estudado.
i) Efeito pepita ( 1 )
Teoricamente, o valor do variograma nulo: 0)( =h para h = 0. Na
prtica h um valor mnimo de h entre amostras para o qual pode ser
quantificado o valor de )(h . Quando esse valor de )( minh elevado,
o que significa que h uma grande variabilidade pequena escala, isto
, referente s menores distncias entre amostras ou observaes, pode
acontecer de )(h no tender para 0 quando h tende para 0. H na
realidade uma
-
inflexo ou descontinuidade no andamento do variograma a uma
escala no captada pelas amostras, isto , entre h = 0 e hmim. Nestas
situaes, o variograma modelado por uma ordenada na origem igual a
uma constante 1 denominada por efeito pepita (SOARES, 2000).
ii) Contribuio ( 2 )
tambm conhecida como varincia de disperso e representa as
diferenas espaciais entre os valores de uma varivel tomada em dois
pontos separados por distncias cada vez maiores.
iii) Alcance ( )( 3ga = )
a distncia a partir da qual os elementos amostrais passam a ser
no correlacionados. Em outras palavras, o alcance reflete o grau de
homogeneizao entre os elementos amostrais, ou seja, quanto maior
for o alcance maior ser a homogeneidade entre as amostras. O
alcance a distncia que separa o campo estruturado (amostras
correlacionadas) do campo aleatrio (amostras independentes).
iv) Patamar ( 21 +=C )
O Patamar ( 21 + ) corresponde ao ponto onde toda semivarincia
da amostra de influncia aleatria, correspondendo a varincia total
(s2) obtida pela estatstica clssica (TRANGMAR et al., 1985).
A Figura 1 ilustra o andamento tpico das funes variograma )(h e
covarincia )(hC .Como a funo variograma uma medida da varincia das
diferenas nos valores da
varivel regionalizada entre pontos separados por uma distncia h,
pontos mais prximos, por estarem correlacionados tero essa varincia
pequena, aumentando medida que os pontos se distanciam.
-
Figura 1 Funes covarincia e variograma.
O contrrio acontece para a funo covarincia, que grande para
distncias pequenas diminuindo medida que a distncia aumenta, pois
esta funo mede a correlao entre pontos separados por uma distncia
h.
2.2.5 Modelagem da estrutura de variabilidade espacial
Os semivariogramas e correlogramas amostrais podem no ser
suficientes para descrever o padro de variabilidade espacial do
fenmeno estudado, visto que contm estimativas apenas para algumas
distncias que a malha amostral permite calcular. Um dos produtos
finais da anlise geoestatstica o mapa temtico gerado por krigagem,
e este tipo de interpolao exige medidas para outras distncias. Os
modelos ajustados para o semivariograma experimental, apresentados
por ISAAKS & SRIVASTAVA (1989) e CRESSIE (1993), so divididos
em modelos transitivos, que possuem patamar, e modelos no
transitivos, que no possuem patamar. Modelos com patamar so aqueles
em que a semivarincia estabiliza-se em torno de um valor chamado
patamar (C) aps certa distncia, chamada alcance (a). Nestes casos,
observaes separadas por distncias maiores que a so consideradas no
correlacionadas. Os modelos esfricos, exponencial, gaussiano,
circular, Matrn e exponencial potncia so exemplos de funes com
patamar. Modelos sem patamar so aqueles em que no h indicao de
estabilizao da semivarincia. Este comportamento pode ser devido ao
fato de que no foram obtidos elementos amostrais suficientes
afastados para que o patamar fosse detectado, ou pode ser uma
indicao de que a hiptese intrnseca no vlida.
-
a) Modelo esfrico
Trata-se de um dos modelos mais usuais em geoestatstica. Ele
apresenta um crescimento rpido a atinge o patamar a 2/3 do alcance.
A funo semivarincia deste modelo tem a forma:
3
321
3
3321 0,
,
21
23
0,0
)(
+
+
=
= h
h
hh
h
h (8)
A funo covarincia dada por:
3
3
3
332
21
0,
,0
21
231
0,
)(
+
=+
= h
h
hh
h
hC (9)
b) Modelo exponencial
Este modelo atinge o patamar assintoticamente, com o alcance
prtico definido como a distncia na qual o valor do modelo 95% do
patamar (ISAAKS & SRIVASTAVA, 1989). A funo semivarincia deste
modelo tem a forma:
3
321
321 0,
,
exp1
0,0
)(
+
+
=
= h
h
h
h
h (10)
A funo covarincia dada por:
>
-
c) Modelo gaussiano
Os modelos esfrico e exponencial apresentam um crescimento
relativamente rpido junto da origem, denunciando um comportamento
tpico de fenmenos relativamente irregulares. Outros fenmenos, bem
mais regulares e contnuos, denunciam um crescimento lento de )(h
com um comportamento parablico na origem. Este o caso de
variogramas ajustveis por modelos gaussianos. A funo semivarincia
deste modelo tem a forma:
3
321
2
321 0,
,
exp1
0,0
)(
+
+
=
= h
h
h
h
h (12)
A funo covarincia dada por:
3
3
2
32
21
0,
,0
exp
0,
)(
=+
= h
h
h
h
hC (13)
d) Modelo circular
O modelo circular apresenta validez apenas nos planos
unidimensionais e bidimensionais, no podendo ser aplicado a planos
tridimensionais, onde aplicado o modelo esfrico. A funo
semivarincia deste modelo tem a forma:
3
321
23
2
33
121 0,
,
12cos21
0,0
)(
pipi
+
+
+
=
= h
h
hhh
h
h (14)
A funo covarincia dada por:
-
+
=
=
0,)(21
0,0
)(33
1121 h
hKhk
h
hk
kk
(16)
em que:
321 ,, e k so parmetros;
kK a funo de Bessel de terceiro tipo, de ordem k ;
A funo covarincia dada por:
( )
>
=
=
0,)(2
0,0
)(33
112 h
hKhk
h
hCk
kk
(17)
2.2.6 Estimao de parmetros
Escolher um modelo adequado implica em obter estimadores do
vetor de parmetro T),,( 321 = com mtodos de estimao tais como:
mnimos quadrados ordinrios
(OLS), mnimos quadrados ponderados (WLS1) (CRESSIE, 1985), mxima
verossimilhana (ML) e mxima verossimilhana restrita (RML) (MARDIA
& MASHALL, 1984).
O mtodo de estimao de mnimos quadrados ordinrios - OLS, consiste
na
obteno de um vetor de parmetros estimador de T),,( 321 = , que
minimiza a Equao (18), onde k indica o nmero de lags que constituem
o semivariograma experimental, )( jh o valor estimado da
semivarincia experimental, que correspondente
-
ao j-simo lag, para j =1, 2,..., k e ),( jh representa o valor
estimado que corresponde ao j-simo lag para j =1, 2,...,k; obtido
pelo modelo ajustado ao semivariograma experimental, e depende do
vetor de parmetros .
[ ]21
),()(=
k
jjj hh ou [ ]2
1),()(
=
k
jjj hChC (18)
O mtodo de estimao de mnimos quadrados ponderados - WLS1 define
pesos diretamente proporcionais ao nmero de pares de pontos
amostrais que contribuem para a semivarincia estimada a cada lag.
Segundo o mtodo, o vetor de parmetros a ser escolhido o que
minimiza a Equao (19):
[ ]21
),()()( jjk
jj hhhN
=
ou [ ]21
),()()( jjk
jj hChChN
=
(19)
A estimao de parmetros por mxima verossimilhana - ML um mtodo
analtico, muito utilizado na teoria estatstica. A funo de
verossimilhana de n variveis aleatrias
Z1,...,Zn definida como a densidade conjunta dada por ZnZf
,...,1 (z1,...,zn; ), que dever ser considerada como uma funo do
vetor de q-parmetros desconhecidos = (1,..., q) (espao paramtrico).
Seja (Z1,...,Zn) um vetor aleatrio n-dimensional de uma populao com
funo densidade de probabilidade conjunta ZnZf ,...,1 (z1,...,zn; ),
ento a funo de verossimilhana ser:
);,...,(,...)( 11 nZZ zzfL n= (20)
A funo de verossimilhana pode ser entendida como a intensidade
de contribuies dos parmetros na produo de uma dada amostra. Sob uma
distribuio normal n-variada dos erros, tem-se ),(~ XNZ n e os
parmetros desconhecidos do modelo podem ser estimados
maximizando-se a funo de verossimilhana, como considerado por
MARDIA & MARSHALL (1984). Por motivos de simplicidade de
clculos, utiliza-se o logaritmo da funo verossimilhana, chamada de
funo log-verossimilhana, definida por:
l ( ) = )2log(2
pin
21 log| )( |
21 (Z X)T )( -1 (Z X) (21)
-
A funo de verossimilhana , basicamente, uma funo do vetor de
parmetros ento, a melhor estimativa para o vetor de parmetros ser
aquela que maximiza a
funo de verossimilhana ou de logaritmo da funo verossimilhana.
Outro mtodo, freqentemente utilizado para estimar os parmetros da
matriz de
covarincia )( o mtodo de mxima verossimilhana restrita RML, que
obtm estimadores menos viciados que os estimadores obtidos por ML.
Nos ensaios de campo na agricultura e nas pesquisas com
melhoramento animal, como mtodo de seleo, a estimao de mxima
verossimilhana restrita dos parmetros de covarincia espacial, tem
sido preferida de mxima verossimilhana (CRESSIE & LAHIRI,
1996). Neste caso, o logaritmo da funo de log-verossimilhana
restrita dada pela equao (22):
,
21|)log(|
21||log
21|)log(|
21)2log(
2)( 1 PZZXXXXpnl TTTR +
=
pi (22)
em que ,
)(1 AIP = , com 111 )( = TT XXXXA .
Com o desenvolvimento de recursos computacionais os mtodos ML e
RML tm sido tcnicas de estimao muito utilizadas, pois tm
propriedades da teoria das grandes amostras que torna o seus
resultados mais eficientes (DIGGLE & RIBEIRO JR., 2007).
2.2.7 Estimador linear geoestatstico: Krigagem
O estimador geoestatstico denominado por Krigagem, que uma
denominao que foi empregue pela primeira vez por Matheron, em
homenagem aos trabalhos pioneiros de Krige. Krigagem Normal
(Ordinary Kriging) a denominao mais usual dos algoritmos de
krigagem, uma famlia que cobre os estimadores no-estacionrios
(Krigagem Simples, Krigagem com modelo de deriva, tambm conhecida
por krigagem universal, e krigagem com deriva externa), o estimador
de corregionalizaes (Co-Krigagem), o estimador de funes de
distribuio de probabilidades, o estimador de variveis categricas
para a caracterizao da morfologia de corpos em fenmenos espaciais
(Krigagem da Indicatriz) e os estimadores no-lineares (Krigagem
MultiGaussiana e Krigagem Disjuntiva). A krigagem ordinria
interpretada como o valor interpolado de uma varivel regionalizada
Z, em um local 0s , podendo ser determinada pela Equao (23):
-
=
=
n
iii sZsZ
10 )()( (23)
restrito a:
=
=
n
ii
11
em que:
)( 0sZ : Representa o valor estimado de Z em 0s ; n: Representa
a quantidade de valores medidos )( isZ ;
i : So os pesos associados aos valores medidos. A krigagem
ordinria para n pontos amostrais constitui-se de 1+n equaes,
com
1+n incgnitas, podendo ser representada por meio de uma equao
matricial dada em (24):
LK = (24) sendo:
=
01...111..........
1...1...
21
22221
11211
nnnn
n
n
CCC
CCCCCC
K ,
=
n
.
2
1
,
=
1
.
0
20
10
nC
CC
L
Nesta equao K uma matriz de semivarincias de ordem )1()1( ++ nxn
entre os pares de pontos amostrados; o vetor de pesos; L um vetor
de semivarincias da amostra em relao ao ponto a ser estimado 0s , e
representa o parmetro de Lagrange. O vetor de parmetros obtido pelo
produto do inverso da matriz K pelo vetor L . No mtodo da krigagem,
os pesos so atribudos de acordo com a variabilidade espacial
expressa no semivariograma, no entanto, o que torna a krigagem um
interpolador timo a maneira como os pesos so distribudos, no sendo
tendencioso, tendo varincia mnima e possibilitando que se conhea a
varincia da estimativa (WEBSTER & OLIVER, 1990).
2.2.8 Validao cruzada
A validao cruzada, ou cross validation, trata-se da adaptao da
estatstica paramtrica de validao cruzada a um conjunto de dados )(
sZ . O processo consiste em
-
retirar-se uma amostra )( 0sZ do conjunto de dados e estimar-se
no local da amostra o valor
)]([ 0sZ , por exemplo, utilizando o estimador linear de
krigagem. Do conjunto formado por
valores reais e estimados )](),([ sZsZ , calcula-se algumas
estatsticas bsicas, como mdias e varincia dos desvios e mdia dos
mdulos dos desvios, com objetivo de aferir a qualidade do modelo
escolhido para o variograma.
CRESSIE (1993) apresenta o erro mdio reduzido ( ER ), o desvio
padro dos erros mdios ( EMDP ) e o desvio padro dos erros reduzidos
( ERS ) como instrumento para avaliar modelos. O erro mdio definido
como:
=
=
n
iii sZsZ
nEM
1)( ))()((
1 (25)
em que: n : representa o nmero de dados;
)( isZ : representa o valor observado no ponto si;
)( )(isZ : representa o valor predito por krigagem ordinria no
ponto is , sem considerar a observao )( isZ .
Esse procedimento pode ser visto como um experimento no qual se
imita o processo de estimao, ao supor que nunca se toma uma amostra
naquela localizao. Uma vez que a estimao feita, pode-se compar-la
ao valor da amostra que foi inicialmente removida do conjunto de
dados amostrais. Este procedimento, mtodo de deixar um fora,
repetido para todas as amostras disponveis (FARACO et al. 2008).
Segundo McBRATNEY & WEBSTER (1986), o erro mdio reduzido
definido como:
=
=
n
i i
ii
s
sZsZn
ER1 )(
)(
)()()(1
(26)
em que:
)( )(is : desvio padro da krigagem no ponto is , sem considerar
a observao )( isZ .
O desvio padro dos erros reduzidos obtido a partir da seguinte
expresso:
=
=
n
i i
iiER
s
sZsZ
nS
1 )(
)(
)()()(1
(27)
-
FARACO et al. (2008) comentam que conhecendo-se o conjunto de
valores medidos e preditos por krigagem ordinria )( isZ e )( )(isZ
, respectivamente, possvel definir o erro absoluto na unidade da
varivel da unidade estudada, pela Equao (28):
=
=
n
iii SZsZEA
1)( )()( (28)
Segundo McBRATNEY & WEBSTER (1986), aplicando-se a condio de
no tendenciosidade, o valor populacional para o erro mdio reduzido
deve ser zero e do desvio
padro do erro reduzido deve ser igual a um. Assim, os valores de
EM e ER mais prximos
de zero, o menor valor do DP e o valor de ERS mais prximo de um
so os critrios para a
escolha do melhor modelo ajustado.
2.2.9 Influncia local
Em muitas situaes pode-se observar um conjunto de dados com
observaes aberrantes ou discrepantes que podem ser consideradas
influentes, isto , mudam algum tipo de deciso na construo de
modelos geoestatsticos (BORSSOI et al., 2009). O mtodo de influncia
local proposto por COOK (1986) avalia o efeito simultneo de
observaes sobre os estimadores de mxima verossimilhana (MV) sem a
necessidade de sua eliminao do conjunto de dados. CHRISTENSEN et
al. (1993) estudam mtodos de diagnsticos baseado em eliminao de
casos em modelos lineares espaciais. Para um conjunto de dados
observados seja l() o logaritmo da funo verossimilhana do modelo
postulado, em que = (, 1, 2, 3)T e seja um vetor de perturbaes
pertencente a um espao de perturbaes . Seja l(/) o logaritmo da
funo verossimilhana correspondente ao modelo perturbado por .
Assume-se que existe um 0 tal que l() = l(/0), para todo e que l(/)
duas vezes diferencivel em (T, T)T . Considere-se o seguinte
esquema de perturbao: Z = Z + , com = (1,...,n)T vetor de perturbao
das respostas e 0 = (0,...,0)T o ponto de no perturbao. Com este
esquema de perturbao pretende-se detectar possveis outliers nos
dados que afetam o estimador de mxima verossimilhana de . Logo o
logaritmo da funo verossimilhana perturbada l(/), para o modelo
gaussiano est dado por:
)()(21||log
21)2log(
2)/( 1 pi XZXZnl T =
.
-
A influncia da perturbao no estimador de MV do vetor de
parmetros pode
ser avaliada pelo afastamento da verossimilhana, definido por
LD() = ))()((2 ll , em
que, : estimador de MV de do modelo postulado; e : estimador de
MV de do modelo
perturbado. COOK (1986) props estudar o comportamento local de
LD() em torno de 0, utilizando a curva normal Cl de LD() em 0 na
direo de algum vetor unitrio l, definido Cl = 2|lTTL-1l|, com ||l||
= 1, em que, L: a matriz de informao observada, avaliada em
= ; : uma matriz de ordem (pq) x n dada por = (T, T)T, avaliada
em = e em = 0, em que,
= XT1 e = Tl
)/(2
, com 112
)()/(
=
i
TT
XZl
,
=
LLLL
L , em que, L = -(XT-1X); L = Tl
)(2
, com
qjXlj
T
j...,,1,)( 11
2
=
=
; L = LT; e L =
T
l
)(2
, com
11121211221
21)(
+
=
ijjiji
T
jijijitr
l
Seja Lmax o auto-vetor, normalizado, associado ao maior
autovalor, em mdulo, da matriz B = TL-1. O grfico dos elementos
|Lmax| versus i (ordem dos dados) pode revelar qual o tipo de
perturbao que tem a maior influncia em LD(), na vizinhana de 0
(COOK, 1986; BORSSOI et al., 2009).
2.2.10 Acurcia em mapas temticos
A elevada quantidade de recursos existentes para elaborao de
informaes acaba levando o pesquisador a confeccionar vrios mapas
temticos, sendo necessrio utilizar tcnicas que possam compar-los,
como a quantificao das reas e a determinao da concordncia entre
seus pixels1, informaes estas que so geradas pela matriz dos erros
dos mapas. A Tabela 1 apresenta a forma genrica de uma matriz dos
erros. Nesta matriz, os pixels do mapa real ou de referncia so
quantificados nas colunas enquanto que os pixels do mapa modelo so
quantificados nas linhas. Cada elemento da matriz representa a
quantidade de pixels pertencentes classe i do mapa modelo e classe
j do mapa de referncia.
1 Aglutinao das palavras Picture e Element, e representa o menor
elemento num dispositivo de exibio ao
qual possvel atribuir-se um valor. Neste trabalho, os pixels
sero definidos com os elementos da matriz dos valores krigados.
-
Tabela 1: Matriz dos erros genrica de ordem k x k Mapa de
referncia
Classe C1 C2 ... Ck Total por
linha ni.
C1 n11 n12 ... n1k n1. C2 n21 n22 ... n2k n2. . . . . .
. . . . .
. . . . .
Ck nk1 nkk ... nkk nk.
M
apa
mo
delo
Total por coluna
n.j n.1 n.2 ... n.k n
k: nmero de classes; nij: nmero de pixels classificados na
classe i do mapa modelo e na classe j do mapa de referncia.
A diagonal principal (quando i = j) representa casos em que os
pixels tiveram a mesma classificao nos dois mapas enquanto que os
elementos fora da diagonal principal representam as classificaes
errneas. Observa-se que se os dois mapas forem iguais, todos os
elementos fora da diagonal principal sero nulos.
Uma mtrica utilizada para avaliar a acurcia dos mapas construdos
a exatido global (EG) do mapa modelo, que tem o objetivo de
determinar o percentual de acerto da classificao realizada e pode
ser extrada da matriz dos erros pela Equao (29).
n
n
EG
k
iii
=
=1
(29)
A exatido global uma estatstica de avaliao utilizada para
mensurar a similaridade entre algo real ou controlado e um modelo
ajustado, porm, conveniente apresentar esta medida associada a
outras mtricas que levem em considerao os demais valores contidos
na matriz dos erros e no somente os valores da diagonal principal.
Os ndices de acurcia de usurio (AU) e acurcia de produtor (AP) so
maneiras de representar a preciso de uma classe ou categoria
individualmente. O ndice de acurcia de usurio (AUi) representa o
quociente entre o nmero de pixels classificados corretamente na
classe i sobre o total de pixels classificados na classe i do mapa
modelo. Este ndice pode ser calculado com os elementos da matriz
dos erros e apresentado na Equao (30):
=
i
iii
n
nAU ; i = 1,...,k (30)
O ndice de acurcia de produtor (APi) uma estatstica que fornece
a probabilidade de um pixel ser classificado na classe i se ele
realmente pertence a classe i. Este ndice obtido pela Equao
(31):
-
i
iii
n
nAP
.
= ; i = 1,...,k (31)
Como GONG & HOWARTH (1990) relatam, o ndice Kappa (COHEN,
1960) uma estatstica utilizada para mensurar a exatido das
classificaes temticas. Este ndice vem sendo recomendado como uma
medida apropriada da exatido por utilizar todos os elementos da
matriz dos erros ao invs de apenas utilizar aqueles que se situam
na diagonal principal da mesma, o que ocorre quando se calcula a
exatido global da classificao. O ndice Kappa fornece uma medida de
concordncia entre os valores do mapa modelo e os valores do mapa de
referncia e segundo CONGALTON & GREEN (1999) pode ser calculado
pela Equao (32):
=
= =
= k
iii
k
i
k
iiiii
nnn
nnnn
K
1
2
1 1 (32)
A varincia do ndice Kappa, utilizada na construo de intervalos
de confiana e testes de hipteses, pode ser calculada conforme a
equao (33):
+
+
= 42
224
21
32
32112
2
112
)1()4()1(
)1()2)(1(2
)1()1(1)(
n
K (33)
em que:
=
=
k
iiin
n 11
1 ; =
=
k
iii nn
n 122
1 ; )(11
23 ii
k
iii nnn
n
=
+= ; 21 1
34 )(1
ji
k
i
k
jij nnn
n
= =
+= .
Utilizando o ndice Kappa juntamente com sua varincia, possvel
construir um intervalo de confiana de (1 - )% utilizando a Equao
(34):
)()%)1(;( 22/ KzKKIC = (34)
Alm dos ndices de exatido global e Kappa, que so muito
utilizados, MA & REDMOND (1995) apresentaram o ndice Tau (T),
que fornece uma medida quantitativa relativamente precisa e
intuitiva sobre a acurcia da classificao. O ndice Tau similar ao
ndice Kappa, sendo calculado conforme a equao (35), em que pk
indica a probabilidades a priori para cada classe.
-
k
k
k
iii
p
pn
n
T
=
=
1
1
(35)
Quando as probabilidades a priori para as classes forem iguais,
temos pi = 1/k, onde k representa o nmero de classes da matriz dos
erros. Uma outra forma de comparar mapas temticos pode ser
utilizada mediante a criao da matriz de confuso por classe
(FIELDING & BELL, 1997), matriz esta que pode ser obtida com os
elementos da matriz dos erros. A Tabela 2 apresenta a forma genrica
da matriz de confuso da k-sima classe.
Tabela 2: Matriz de confuso da k-sima classe Mapa de
referncia
Verdadeiro (V) Falso (F) Verdadeiro (V) ak bk
Ma
pa
mo
delo
Falso (F) ck dk
Em que:
ak = kkn : quantidade de pixels da classe k do mapa real que
foram classificados
corretamente como pertencentes a classe k no mapa modelo.
bk = :kkk nn quantidade de pixels que no pertencem a classe k do
mapa real e
foram classificados como pertencentes a classe k no mapa
modelo.
ck = :kkk nn quantidade de pixels que pertencem a classe k do
mapa real e que
pertencem a uma classe diferente no mapa modelo.
dk = :)( kkk cban ++ quantidade de pixels que no pertencem a
classe k no mapa real e foram classificados como no pertencente a
classe k no mapa modelo.
A Tabela 3 apresenta algumas mtricas, derivadas da matriz de
confuso por classe, e utilizadas na comparao dos mapas temticos. O
ndice de sensibilidade (Sk) uma medida que indica a probabilidade
de um pixel no mapa modelo ser classificado como pertencente classe
k se realmente ele pertence classe k no mapa real, sendo assim uma
medida equivalente acurcia de produtor (FIELDING & BELL
1997).
-
Tabela 3: Mtricas derivadas da matriz de confuso por classe
Mtrica Equao
ndice de sensibilidade (Sk) ak/(ak+ck) ndice de especificidade
(Ek) dk/(bk+dk) Taxa de falso positivo (TFPk) (Erro de comisso)
bk/(bk+dk) Taxa de falso negativo (TFNk) (Erro de omisso)
ck/(ak+ck)
O ndice de especificidade (Ek) indica a probabilidade de um
pixel no pertencente classe k do mapa real ser classificado como no
pertencente classe k no mapa modelo (LURZ et al. 2001). Os erros de
comisso tambm so conhecidos como erros de superestimativa, ou seja,
indicam a proporo de pixels que no pertencem classe k no mapa real
que so classificados como pertencentes classe k no mapa modelo. Os
erros de omisso so considerados graves, pois indicam a proporo de
pixels que pertencem classe k do mapa real e foram classificados em
outras classes no mapa modelo. Com base nessas mtricas, possvel
comparar individualmente as classes do modelo com as classes do
mapa real. Para uma comparao global dos mapas, JENNESS & WYNNE
(2005) apresentam a matriz de confuso total, indicada na Tabela
4.
Tabela 4: Matriz de confuso total Mapa de referncia
Verdadeiro (V) Falso (F) Verdadeiro (V) a =
=
k
iiin
1
b ==
k
i
k
ijijn
1
Ma
pa M
ode
lo
Falso (F) c = =
k
j
k
jiijn
1 d =
=
k
i
k
ji
k
ijijn
1
A Tabela 5 apresenta algumas mtricas derivadas da matriz de
confuso total. Os ndices de sensibilidade total (S) e
especificidade total (E) so anlogos s suas verses por classe, com a
diferena de que agora apresentam medidas para o mapa completo. O
coeficiente de correlao de Matthews (CCM) uma verso discreta do
coeficiente de correlao de Pearson, e seus valores se encontram no
intervalo [-1;1], sendo que o valor 1 equivale a uma predio
perfeita, 0 equivale a uma predio aleatria e -1 significa uma
predio inversa.
Tabela 5 Mtricas derivadas da matriz de confuso total Mtrica
Equao
S a/(a+c) E d/(b+d)
CCM ((ad)-(bc))/((a+b)(a+c)(d+b)(d+c))(1/2)
-
2.2.11 Modelagem cartogrfica
A modelagem cartogrfica um tipo de tcnica de anlise espacial,
que consiste numa coleo de mapas sobre determinados atributos, onde
cada mapa uma varivel sujeita a operaes matemticas tradicionais. A
modelagem cartogrfica apresenta-se hoje como uma importante tcnica
de anlise espacial geogrfica. Ela aparece, como definio, num
contexto de utilizao de tecnologias de Geoprocessamento, no incio
da dcada de 1990, com TOMLIN (1990), em que ele introduz um
conceito novo - lgebra de mapas -, atualmente muito explorado por
pesquisadores e desenvolvido em alguns softwares de
Geoprocessamento.
Segundo BERRY (1993), uma linguagem de modelagem cartogrfica usa
uma sequncia de funes primitivas para realizar uma anlise complexa
de mapas. Nesse sentido, ela semelhante lgebra tradicional, na qual
operadores primitivos (adio, subtrao, exponenciao) so logicamente
sequenciados com variveis para que se forme uma equao. No entanto,
na lgebra cartogrfica, mapas inteiros representam as variveis. A
unidade bsica de processamento o pixel, que pode ser processado
independentemente, integrado numa vizinhana ou integrado em regio
de elementos com o mesmo atributo.
-
2.3 MATERIAL E MTODOS
2.3.1 Material
A anlise de um conjunto de dados reais foi efetuada com o
propsito de ilustrar a aplicao das tcnicas geoestatsticas. A rea
experimental compreende uma rea de produo de gros com 13,7 hectares
de extenso, localizada no municpio de Salto do Lontra PR, que foi
cultivado com trigo variedade IAPAR 78. Na rea monitorada, foi
definida uma grade amostral regular de 50 x 50 m totalizando 50
posies georreferenciadas (Figura 2 (A)). Na Figura 2 (B) observa-se
que esta rea tambm foi dividida em nove talhes denominados de A a
I, para facilitar a colheita mecnica e com isso poder determinar a
produo real. A pequena rea em cinza na Figura 2 (B) representa uma
regio de pedras que no monitorada no experimento.
Figura 2 (A) Localizao dos 50 pontos amostrais e (B) Diviso da
rea em talhes.
Nos pontos de amostragem, foram coletadas as parcelas de trigo.
Estas amostras foram trilhadas de forma manual, pesadas e
posteriormente transformadas em t ha-1.
A anlise geoestatstica foi realizada utilizado os pacotes geoR
(RIBEIRO JR & DIGGLE, 2001) e Splancs ( ROWLINGSON &
DIGGLE, 1993) do software R.
2.3.2 Metodologia
Uma anlise geoestatstica composta de diversos procedimentos que
devem ser utilizados com bastante cautela, pois no se tratam de uma
simples aplicao de frmulas para obter resultados. Para uma correta
investigao o pesquisador deve sempre estar refazendo e comparando
suas anlises, e isto faz com que o roteiro a ser seguido, bem como
os resultados intermedirios e finais no sejam obtidos de forma
nica.
-
A seguir so descritos os passos da anlise geoestatstica.
Inicia-se com uma anlise exploratria que vem seguida de diversos
procedimentos at a confeco de mapas temticos que detalhem o
comportamento do atributo estudado.
a) Anlise descritiva geral
Em uma anlise descritiva geral, a nica informao investigada o
conjunto amostral do atributo estudado - assim, a posio do atributo
no considerada. O objetivo fundamental a identificao inicial do
comportamento dos dados, sem nenhuma pretenso de inferncia. O uso
de medidas de posio, tendncia central, variao, assimetria e
curtose, associadas a informaes grficas como o histograma, boxplot
e ramo-e-folhas permite uma primeira viso dos aspectos gerais do
conjunto de dados.
b) Anlise descritiva espacial
Embora seja mais detalhada que a anlise descritiva geral, uma
vez que leva em considerao a posio da amostra, a inteno to somente
ter um indicativo do comportamento dos dados agora associando-os s
suas posies na regio amostrada. Um grfico que rico em informao o
postplot, que consiste em apresentar a malha de pontos coletados
separados por cores/smbolos identificando os quartis da distribuio
dos dados. A partir deste grfico possvel identificar se existem
regies com concentrao de altos ou baixos valores amostrais. Uma
outra opo de anlise um grfico tridimensional que mostra a superfcie
definida pela amostra. A anlise idntica feita com o grfico postplot
e d uma idia visual inicial do comportamento do atributo na regio
estudada.
c) Anlise variogrfica
Para que a interpolao por krigagem possa ser realizada com
eficcia, so necessrias estimativas de semivarincias (covarincias)
para distncias alm das fornecidas pela malha amostral. Um modelo
que descreva a semivarincia (covarincia) em funo da distncia ento
ajustado a partir de um conjunto discreto de pontos, estimativas da
semivarincia (covarincia) para os diferentes lags. No presente
trabalho foram avaliados os modelos exponencial, esfrico e
gaussiano utilizando os mtodos de estimao de mnimos quadrados
ordinrios (OLS), mnimos quadrados ponderados, mxima verossimilhana
(ML) e mxima verossimilhana restrita (RML).
-
d) Validao cruzada
A idia central avaliada pela validao cruzada que se o fenmeno
foi satisfatoriamente modelado, possvel reproduzir, com boa
aproximao, informaes da amostra. Desta forma, o procedimento
consiste em retirar um ponto do conjunto original das amostras
coletadas e estim-lo utilizando o restante das amostras. Aps
realizar a estimativa de todos os pontos, possvel obter medidas que
ajudem a escolher o modelo que melhor descreva a variabilidade
espacial do atributo estudado.
e) Krigagem ordinria
Na maioria das pesquisas relacionadas geoestatstica, o
profissional est interessado em estimar valores em locais no
amostrados, seja por um interesse local ou pela inteno de obter um
detalhamento da rea que vai alm do permitido pela amostra. Nestes
casos, o procedimento adotado a interpolao. A literatura apresenta
uma vasta coleo de interpoladores, desde os conhecidos modelos
deterministas, como polgonos de influncia, triangulao e inverso do
quadrado das distncias, at a proposta de predio geoestatstica,
conhecida como krigagem. Neste trabalho ser utilizado a krigagem
ordinria, interpolador mais eficaz que os deterministas por
incorporar a estrutura de dependncia espacial do atributo
estudado.
f) Anlise de diagnstico
Com o objetivo de investigar a existncia de pontos influentes no
conjunto amostral do atributo estudado, ser analisado o grfico de
influncia local ixLmax (ordem dos dados), que prope avaliar a
influncia conjunta das observaes sob pequenas perturbaes no modelo,
identificando assim, pontos que possam causar alguma interferncia
ou provoquem grandes desvios nos resultados do ajuste.
g) Comparao de mapas
Para comparar mapas obtidos por diferentes tcnicas, sero
utilizadas as mtricas derivadas da matriz dos erros e tambm ser
criando um mapa de diferenas utilizando a lgebra de mapas.
A Figura 3 apresenta o roteiro desta anlise. Observa-se que dois
mapas sero gerados. O primeiro obtido pelo ajuste de um modelo
terico, selecionado por validao cruzada, utilizando todos os pontos
do conjunto de dados amostrais, e o segundo, utilizando
-
a anlise de diagnsticos para retirar pontos detectados como
influentes. Para finalizar o estudo, os mapas sero comparados
utilizando a subtrao em mdulo de um mapa pelo outro, que evidencia
regies que foram diferentes em ambos os mapas e tambm ser construda
a matriz dos erros, considerando o mapa com todos os pontos como o
de referncia e o mapa sem os pontos influentes como modelo. Com
esta matriz, ser possvel calcular as mtricas de acurcia.
Figura 3 Roteiro da anlise geoestatstica.
-
2.4 RESULTADOS E DISCUSSO
A anlise exploratria dos elementos amostrados apresentou uma
produtividade mdia de trigo de 1,31 t ha-1, sendo a produo mnima de
0,30 t ha-1 e mxima de 2,40 t ha-1 com desvio padro de 0,54 t ha-1
e coeficiente de variao (CV) de 41,40%. Apesar desta alta
heterogeneidade entre os valores amostrais (CV > 30%), pode-se
considerar que o conjunto apresenta uma distribuio normal de
probabilidades, pois pelo teste de normalidade de Anderson-Darling
obteve-se um nvel descritivo (p-valor) de 0,102 o que indica
normalidade dos dados com nvel de 5% de significncia. Analisando o
grfico boxcox da produtividade de trigo na Figura 4, observa-se que
no h necessidade de transformar os dados, visto que o 1=
encontra-se no intervalo de 95 % de confiana.
Figura 4 Grfico boxcox da produtividade de trigo.
A Figura 5 apresenta o grfico espacial da rea em estudo,
representando a produtividade de trigo classificada por
quartis.
Figura 5 - Grfico espacial da produtividade de trigo.
-
Destaca-se nesse grfico a regio norte da rea por apresentar um
aglomerado com produtividade baixa e a regio leste por apresentar
um aglomerado com maiores valores de produtividade. A Figura 6
apresenta o grfico boxplot da produtividade de soja.
Figura 6 Grfico boxplot da produtividade de trigo.
Observando o grfico da Figura 6 observa-se que o conjunto de
dados simtrico e tambm destaca-se a ausncia de pontos discrepantes
no conjunto de dados amostrais. Com finalidade de verificar a
existncia de tendncias, heterogeneidades de varincias e
comportamentos isolados foram construdos os grficos da Figura 7.
Para cada linha e coluna foram assinalados os valores
encontrados.
Figura 7 Grfico das coordenada versus produtividade de
trigo.
Nos dois grficos existem pequenas flutuaes dos valores em relao
mdia. Porm, isto no caracteriza problemas visto que em ambas as
direes as disperses so semelhantes. As anlises exploratrias indicam
que o comportamento do conjunto de dados
-
de produtividade de trigo no mostra problemas que afrontem as
hipteses de estacionaridade.
Para realizar o estudo variogrfico, necessrio conhecer a
distncia mxima entre os pontos amostrais, com intuito de definir o
ponto de corte. Para construir o semivariograma utilizando o
conjunto amostral a distncia mxima entre duas amostras de 487,8781
m e como vamos padronizar um corte de 50% (CLARK, 1979), a distncia
a ser considerada ser de 244 m. Para identificar a existncia de
anisotropia, construiu-se os semivariogramas direcionais da Figura
8.
Figura 8 Semivariogramas direcionais da produtividade de
trigo.
Observa-se na Figura 8 que os semivariogramas direcionais
apresentam um comportamento semelhante para as direes monitoradas,
indicando que os dados so isotrpicos e assim, podemos considerar um
nico semivariograma, conhecido como semivariograma omnidirecional,
apresentado na Figura 9.
Figura 9 Semivariograma experimental da produtividade de
trigo.
Observa-se que a primeira semivarincia encontra-se na distncia
de 50 m, indicando que no se tem conhecimento do fenmeno a menores
distncias. Este semivariograma foi gerado utilizando o estimador de
Matheron e um ngulo de tolerncia de 22,5 o. Uma forma de investigar
a dependncia espacial proporcionada pela construo de
-
envelopes simulados, apresentados na Figura 10. Na anlise dos
envelopes simulados deve haver ao menos um ponto do semivariograma
fora do envelope. Se isso ocorrer rejeita-se a hiptese nula, de que
no h dependncia espacial.
Figura 10 Envelopes simulados.
Nesta simulao encontrou-se um ponto fora dos envelopes, conforme
destacado na Figura 9. Este fato sugere a existncia de correlao
espacial da produtividade de trigo na rea monitorada. Destaca-se
que foi estipulado um mnimo de 30 pares de pontos para cada
semivarincia plotada nos grficos das Figuras 8,9 e 10. A Tabela 6
apresenta informaes mais detalhadas do semivariograma experimental
da produtividade de trigo, como a distncia em que foi computada a
semivarincia e o nmero de pares utilizados.
Tabela 6 Parmetros do semivariograma omnidirecional h pares
(h)
50,846 82 0,141 69,538 75 0,194
100,692 66 0,240 113,154 123 0,241 144,308 53 0,277 150,538 53
0,265 156,769 97 0,295 181,692 82 0,342 200,385 38 0,382 206,615 71
0,383 212,846 32 0,354 225,308 60 0,342
Observa-se na Tabela 6 que a maior quantidade de pares ocorreu a
uma distncia de 113,15 m, com 123 pares. A menor quantidade de
pares ocorreu a uma distncia de 212,84 m, com 32 pares - porm,
superior ao limite definido a priori de 30 pares de pontos.
A Tabela 7 apresenta as estimativas dos parmetros referentes aos
ajustes dos modelos tericos de semivariograma, juntamente com os
respectivos mtodos de
-
estimao. Observa-se que o maior raio de dependncia espacial
obtido com o modelo exponencial, com aproximadamente 389 m nos
mtodos WLS1, ML e RML.
Tabela 7 - Modelos ajustados e parmetros obtidos do conjunto
amostral completo da produtividade de trigo [t ha-1]
Modelo Mtodo a 1 2 1 + 2 E(%) OLS 359,4886 0,0000 0,4229 0,4229
0,00
WLS1 389,4457 0,0000 0,4373 0,4373 0,00 ML 389,4450 0,0166
0,3518 0,3684 4,51 Exponencial
RML 389,4452 0,0086 0,3848 0,3934 2,19 OLS 310,1955 0,0672
0,3392 0,4064 16,54
WLS1 311,3712 0,0669 0,3405 0,4074 16,42 ML 137,6487 0,0117
0,2611 0,2728 4,29 Esfrico
RML 141,7012 0,0105 0,2759 0,2864 3,67 OLS 276,7686 0,1300
0,2797 0,4097 31,73
WLS1 273,0037 0,1284 0,2787 0,4071 31,54 ML 269,1884 0,1051
0,2961 0,4012 26,20 Gaussiano
RML 302,6388 0,1056 0,4164 0,522 20,23 OLS: mnimos quadrados
ordinrios, WLS1: mnimos quadrados ponderados, ML: mxima
verossimilhana, RML: mxima verossimilhana restrita, a: ancance, 1 :
efeito pepita, 2 : contribuio, 1 + 2 : patamar e E: efeito pepita
relativo 100.( 1 /( 1 + 2 ))
O efeito pepita relativo (E) na Tabela 7 utilizado para mensurar
o grau de dependncia espacial segundo a classificao proposta por
CAMBARDELLA et al. (2004). Observa-se que os ajustes utilizando
modelos exponenciais apresentam os menores valores para o efeito
pepita relativo, indicando uma forte dependncia espacial. Dos
quatro ajustes realizados com o modelo gaussiano, 3 deles
apresentam coeficiente de efeito pepita relativo superior a 25 %,
indicando uma moderada dependncia espacial.
Como tem-se vrios modelos e mtodos, necessrio utilizar tcnicas
que permitam escolher o melhor ajuste, como por exemplo, a validao
cruzada, apresentada na Tabela 8.
Tabela 8 - Validao cruzada para a produtividade de trigo [t
ha-1] relativa a todo o conjunto amostral
Modelo Mtodo EM ER
DPEM SER EA OLS -0,002074 -0,002220 0,3564242 0,9521044
12,78630
WLS1 -0,002310 -0,0025460 0,3563375 0,9716647 12,78598 ML
-0,001719 -0,001899 0,3581258 0,9950070 12,84087 Exponencial
RML -0,002006 -0,002238 0,3571692 0,9924911 12,79904 OLS
-0,002417 -0,002660 0,3674936 0,9379480 13,43437
WLS1 -0,002439 -0,002689 0,3675304 0,9391278 13,43475 ML
0,0005531 0,0010620 0,3620052 0,9890566 13,10038 Esfrico
RML 0,0002486 0,0006794 0,3630399 0,9865988 13,20557 OLS
-0,001874 -0,001957 0,3687667 0,9190851 13,54737
WLS1 -0,001864 -0,001948 0,3683358 0,9220606 13,52683 ML
-0,002367 -0,002709 0,3652186 1,0011898 13,41738 Gaussiano
RML -0,003308 -0,003882 0,3645614 1,0007248 13,42031 EM : erro
mdio, ER : erro mdio reduzido, DPEM :desvio padro do erro mdio,
SER: desvio padro dos erros reduzidos e EA: erro absoluto.
-
Segundo o critrio de validao cruzada o melhor modelo o que
fornece os valores
de EM e ER mais prximos de zero, o valor DPEM menor e o valor de
SER mais prximo de um. Optou-se por escolher o modelo exponencial -
ML como o que melhor se ajustou, visto que das cinco estatsticas
investigadas ele apresenta um melhor desempenho em trs.
A Figura 11 (A) apresenta o grfico de diagnstico dos
auto-vetores |Lmax|, utilizando o modelo espacial exponencial
ML.
Figura 11 - (A) Grfico de diagnstico |Lmax|; (B) Localizao dos
pontos influentes na rea monitorada.
Verifica-se que as observaes 12 e 18 foram consideradas
influentes e podem mudar algum tipo de deciso na construo de
modelos geoestatsticos e/ou na construo dos mapas temticos. A
Figura 11 (B) apresenta a localizao dos pontos influentes na rea
monitorada. A amostra no 12 refere-se a uma produtividade de 2,40 t
ha-1 e a amostra no 18 representa um elemento amostral com
produtividade de 0,55 t ha-1. Desta forma, optou-se por fazer uma
nova anlise variogrfica retirando os dois pontos considerados
influentes e verificando de que maneira eles afetam a anlise
espacial. A Figura 12 apresenta o semivariograma experimental da
produtividade de trigo gerado sem os dois pontos influentes.
Destaca-se um comportamento semelhante quando comparado com o
semivariograma que foi construdo com todos os pontos amostrais na
Figura 9.
Figura 12 Semivariograma experimental construdo sem os pontos
influentes.
-
A Tabela 9 apresenta os parmetros ajustados utilizando os mtodos
de estimao de mnimos quadrados ordinrios (OLS), mnimos quadrados
ponderados (WLS1), mxima verossimilhana (ML) e mxima verossimilhana
restrita (RML) sem os pontos influentes.
Tabela 9 - Modelos ajustados e parmetros do conjunto amostral da
produtividade de trigo [t ha-1] sem as amostras influentes
Modelo Mtodo a 1 2 1 + 2 E(%) OLS 545,3916 0,0000 0,4836 0,4836
0,00
WLS1 549,0667 0,0000 0,4847 0,4847 0,00 ML 562,9345 0,0000
0,4178 0,4178 0,00 Exponencial
RML 389,4452 0,0000 0,317 0,317 0,00 OLS 246,9547 0,0144 0,3262
0,3406 4,23
WLS1 233,5746 0,0000 0,3332 0,3332 0,00 ML 140,2367 0,0000
0,2173 0,2173 0,00 Esfrico
RML 142,0542 0,0000 0,2243 0,2243 0,00 OLS 225,0066 0,0786
0,2700 0,3486 22,55
WLS1 225,0065 0,0783 0,2695 0,3478 22,51 ML 121,3996 0,0143
0,2477 0,2620 5,46 Gaussiano
RML 125,6102 0,0165 0,2644 0,2809 5,87
Observa-se que os ajustes realizados utilizando o modelo
exponencial com os mtodos OLS, WLS1 e ML apresentaram um raio de
dependncia espacial superior distncia mxima que de 487, 8781 m e
portanto, estes modelos sero desconsiderados da anlise, pois apesar
de estarem matematicamente corretos, eles no condizem com a
realidade. A Tabela 10 apresenta as estatsticas da validao cruzada
referentes ao conjunto de dados sem os pontos influentes.
Novamente, procura-se por valores de EM e ER
mais prximos de zero, menores valores para o DPEM , valores de
SER mais prximo de um e o menor erro absoluto. Analisando a Tabela
10, optou-se por escolher o gaussiano RML como o modelo que melhor
se ajusta ao semivariograma experimental gerado com o conjunto de
dados composto de 48 elementos amostrais.
Tabela 10 - Validao cruzada para a produtividade de trigo [t
ha-1] sem as amostras influentes
Modelo Mtodo EM ER
DPEM SER EA Exponencial RML 0,0009800 0,0017480 0,3053484
0,9413290 10,76085
OLS 0,0010440 0,0018390 0,2974865 0,8996713 10,42330 WLS1
0,0011600 0,0021600 0,2918369 0,9390484 10,26458
ML 0,0037200 0,0057110 0,3017940 0,9260413 10,74068 Esfrico RML
0,0036180 0,0055120 0,3026852 0,9203176 10,77810 OLS 0,0007296
0,0015100 0,3222009 0,9596583 11,35211
WLS1 0,0007271 0,0015100 0,3221772 0,9614916 11,35204 ML
0,0026980 0,0048850 0,2720037 1,0011951 9,813561 Gaussiano
RML 0,0019660 0,0036590 0,2723834 0,9993793 9,73965 EXP:
exponencial, ESF: esfrico, GAUSS: gaussiano, EM : erro mdio, ER :
erro mdio reduzido, DPEM :desvio padro do erro mdio, SER: desvio
padro dos erros reduzidos e EA: erro absoluto.
-
A Figura 13 (A) apresenta o semivariograma experimental do
conjunto completo de dados juntamente com o modelo ajustado
(exponencial ML), e a Figura 13 (B) apresenta o semivariograma
experimental gerado sem os pontos influentes juntamente com o
modelo ajustado (gaussiano RML). Conclui-se que os pontos
influentes alteram a escolha do modelo e os valores dos
parmetros.
Figura 13 Semivariogramas ajustado: (A) completo e (B) sem os
pontos influentes.
A Figura 14 (A) apresenta o mapa da produtividade de trigo
gerado por krigagem ordinria utilizando os parmetros ( 1 = 0,0166;
2 = 0,3518; a = 389,4450) fornecidos pelo modelo exponencial ML,
obtidos do estudo realizado com todo o conjunto amostral e a Figura
14 (B) apresenta o mapa gerado utilizando os parmetros ( 1 =
0,0165; 2 = 0,2644; a = 125,6102) fornecidos pelo modelo gaussiano
RML, obtidos pelo estudo dos dados sem as amostras influentes. Para
construo destes mapas, foi criado um grid de interpolao formado por
5423 pixels.
Observa-se que os mapas apresentam um comportamento semelhante.
Porm, possvel identificar diferenas, no somente nos locais dos
pontos influentes como tambm em outras regies.
Figura 14 - (A) Mapa temtico da produtividade de trigo
utilizando 50 elementos amostrais na interpolao e (B) Mapa temtico
da produtividade de trigo utilizando 48 elementos amostrais na
interpolao.
Destaca-se que os mapas foram construdos utilizando 5 classes,
sendo este nmero definido de tal forma que possibilite tanto uma
identificao visual das reas de
-
produtividade quanto uma praticidade em realizar aplicaes
localizadas de insumos, pois uma grande quantidade de intervalos
implica em reas muito pequenas em cada classe, o que dificulta a
demarcao no campo. A diferena entre os mapas melhor visualizada na
Figura 15, que apresenta o mapa temtico da diferena de
produtividade em mdulo entre os dois mapas.
Figura 15 - Mapa da diferena de produtividade em mdulo entre os
dois mapas
Observa-se na Figura 15 que as regies de maior diferena so
exatamente as regies dos pontos influentes. Porm, diversas outras
regies apresentam diferenas, o que mostra que a retirada dos pontos
influentes afetou o mapa como um todo.
Para melhor comparar estes mapas, conveniente quantificar seus
5423 pixels em uma matriz, conhecida como matriz dos erros,
definindo o mapa gerado com todos os pontos como o de referncia,
visto que ele elaborado por mtodos geoestatsticos mais conhecidos e
o mapa gerado sem os pontos influentes como o mapa modelo, devido
implantao dos estudos de diagnsticos em influncia local. A Tabela
11 apresenta a matriz dos erros que compara os dois mapas.
Tabela 11 - Matriz dos erros dos pixels dos mapas de
produtividade de trigo Mapa Padro
Mapa Modelo C1 C2 C3 C4 C5 TOTAL
C1 485 272 9 0 0 766 C2 45 1202 124 18 0 1389 C3 7 206 1218 99
19 1549 C4 0 0 135 616 241 992 C5 0 0 0 135 592 727
TOTAL 537 1680 1486 868 852 5423 C1: [0,371; 0784),
C2:[0,784;1,198), C3:[1,198; 1,611), C4:[1,611; 2,024) e C5:[2,024;
2,437).
-
Na matriz dos erros, os pixels do mapa padro ou de referncia so
quantificados nas colunas e os pixels do mapa modelo so
quantificados nas linhas. Assim, tem-se que dos 5423 pixels, 537
esto na primeira classe do mapa padro e 766 esto na primeira classe
do mapa modelo.
Esta primeira informao permite realizar uma estimativa da produo
de trigo na rea para ser comparada com a produo de trigo real,
colhida e pesada pelo produtor, que foi de 18,49 toneladas. A rea
total monitorada de 13,551 hectares e esta corresponde a 5423
pixels. Realizando uma regra de trs, podemos verificar que os 537
pixels da primeira classe do mapa gerado com todos os pontos
representam uma rea de 1,3419 hectares. Multiplicando esta rea pelo
ponto mdio da primeira classe (0,5778), obtemos a estimativa de
0,78 toneladas. Seguindo o mesmo procedimento para as outras
classes, obtemos as estimativas da Tabela 12.
Tabela 12 Produo (t) estimada em cada classe MAPA C1 C2 C3 C4 C5
Total
Referncia 0,78 4,16 5,21 3,94 4,75 18,84 Modelo 1,11 3,44 5,43
4,50 4,05 18,54
Observa-se na Tabela 12 que a produo total estimada pelo mapa
padro foi de 18,84 toneladas, 350 quilos superior produo real, que
foi de 18,49 toneladas e a produo total estimada utilizando o mapa
modelo foi de 18,54 toneladas, 50 quilos superior produo real.
Diante desta observao, destaca-se que a retirada dos pontos
influentes foi de grande importncia na anlise, pois permitiu
estimar a produo com maior preciso. A diagonal principal da matriz
dos erros da Tabela 11 indica a quantidade de pixels classificados
identicamente nos dois mapas. Estes elementos permitem calcular a
exatido global (EG), uma das primeiras medidas de acurcia que pode
ser utilizada na comparao dos mapas. Da Tabela 11 tem-se que EG =
0,76 ou seja, a exatido global foi de 76 %. Este valor tambm indica
que os mapas temticos apresentam diferenas, pois de acordo com
ANDERSON et al. (1976), o nvel mnimo de preciso aceitvel de 85 %. A
acurcia pode ser investigada para cada classe individualmente por
meio da anlise dos ndices de acurcia de usurio e de produtor,
apresentados na Tabela 13.
Tabela 13 ndices de acurcia de usurio (AU) e produtor (AP)
C1:[0,371;0784) C2:[0,784;1,198) C3:[1,198; 1,611)
C4:[1,611;2,024) C5:[2,024;2,437) AUi 0,6432 0,8654 0,7863 0,6210
0,8143 APi 0,9032 0,7155 0,8197 0,7097 0,6948
Observa-se pela Tabela 8 que a classe C4 do mapa modelo
apresentou um ndice de acurcia de usurio de 0,6210 o que indica que
37,9 % dos pixels que pertencem a esta
-
classe no mapa modelo pertencem a outras classes no mapa de
referncia. Observando o ndice de acurcia de produtor da classe C4,
tem-se que a probabilidade de um pixel ser classificado nesta
classe do mapa modelo se ele realmente pertence a esta classe no
mapa de referncia de 0,7097. A Tabela 14 apresenta o ndice Kappa
com sua respectiva varincia. Analisando a Tabela 14, observa-se que
o valor de Kappa 0,69, o que, segundo classificao de LADIS &
KOCK (1997), indica uma semelhana muito boa.
Tabela 14 - Estatsticas do ndice Kappa ( K ) K
0,69 )(2 K 0,00084
IC(K, 95%) [0,63; 0,75]
O ndice Tau obtido da matriz dos erros considerando a igualdade
das probabilidades a priori para cada classe foi 0,70, que apesar
de ser superior ao ndice Kappa, tambm indica uma semelhana muito
boa entre os mapas temticos da produtividade de trigo. A Tabela 15
apresenta os elementos das matrizes de confuso da classe Ck, que so
utilizados para calcular mtricas adicionais, proporcionando uma
investigao mais detalhada.
Tabela 15 Elementos (pixels) da matriz de confuso da classe
Ck
Ck ak bk ck dk C1 485 281 52 4605 C2 1202 187 478 3556 C3 1218
331 268 3606 C4 616 376 252 4179 C5 592 135 260 4436
Como os elementos ak e dk representam predies corretas e os
elementos bk e ck representam predies errneas, destaca-se a classe
C1 com apenas 4% de pixels classificados erroneamente e a classe C4
com 11% de pixels classificados erroneamente. A Tabela 16 apresenta
as mtricas obtidas das matrizes de confuso de cada classe Ck.
Tabela 16 Mtricas obtidas das matrizes