Camilo Daleles Rennó [email protected]http://www.dpi.inpe.br/~camilo/ estatistica/ Estatística: Aplicação ao Sensoriamento Estatística: Aplicação ao Sensoriamento Remoto Remoto SER 202 - ANO 2015 SER 202 - ANO 2015 Simulação Estocástica Simulação Estocástica
18
Embed
Camilo Daleles Rennó [email protected] camilo/estatistica/ Estatística: Aplicação ao Sensoriamento Remoto SER 202 - ANO 2015 Simulação.
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Estatística: Aplicação ao Sensoriamento RemotoEstatística: Aplicação ao Sensoriamento Remoto
SER 202 - ANO 2015SER 202 - ANO 2015
Simulação EstocásticaSimulação Estocástica
SimulaçãoSimulaçãoO que é Simulação?é um experimento realizado a partir de modelos (reais ou virtuais)Pode ser:determinística: as entradas do modelo são fixas e para uma determinada
combinação de valores de entrada o resultado final é sempre o mesmoestocástica (ou probabilística): o modelo e/ou as entradas incorporam variações
aleatórias de modo que os resultados são diferentes a cada simulação
Para que fazer Simulação?avaliar propagação de incertezas (quando a solução analítica é inviável)avaliar cenários futuros (resultados possíveis)testar a sensibilidade de parâmetros de um modeloestimar pontualmente ou por intervalo um determinado resultado de um modelotestar a significância de um resultado num teste de hipótese
MODELOX1
X2...Xn
Y
entrada fixa + modelo determinístico
MODELOX1
X2...Xn
Y
entrada fixa + modelo estocástico
MODELOY
X1
X2
Xn
entrada estocástica + modelo determinístico
Simulação de Monte CarloSimulação de Monte Carlo
É um método que avalia um modelo determinístico através da aleatorização das entradas deste modelo.
É particularmente útil quando o modelo é complexo, não-linear, ou quando envolve muitos parâmetros de entrada (com diferentes graus de incerteza), o que dificultaria uma solução analítica.
Através de um grande número de repetições (acima de 1000), garante-se que todas as combinações de entradas possam ser avaliadas.
O termo Monte Carlo foi dado em homenagem a roleta, jogo muito popular de Monte Carlo, Mônaco.
1
2
3
45
0X ~ Binomial (n = 5; p = 0,4)
x P(X = x)0 7,78%1 25,92%2 34,56%3 23,04%4 7,68%5 1,02%
Geração de Números AleatóriosGeração de Números Aleatórios
Originalmente os números aleatórios eram gerados usando dados, roletas, tabelas, etc.
Atualmente os computadores são usados para gerar números chamados pseudo-aleatórios, que constituem uma sequencia de valores que, embora sejam gerados de forma determinística, simulam variáveis aleatórias uniformes [0,1] independentes.
Qualquer variável aleatória pode ser simulada a partir de uma variável aleatória uniforme [0,1] desde que se conheça a função de distribuição F(x) = P(X x).X ~ Binomial (n = 5; p = 0,4)x P(X = x) P(X x)0 7,78% 7,78%1 25,92% 33,70%2 34,56% 68,26%3 23,04% 91,30%4 7,68% 98,98%5 1,02% 100,00%
Geração de Números AleatóriosGeração de Números Aleatórios
Originalmente os números aleatórios eram gerados usando dados, roletas, tabelas, etc.
Atualmente os computadores são usados para gerar números chamados pseudo-aleatórios, que constituem uma sequencia de valores que, embora sejam gerados de forma determinística, simulam variáveis aleatórias uniformes [0,1] independentes.
Qualquer variável aleatória pode ser simulada a partir de uma variável aleatória uniforme [0,1] desde que se conheça a função de distribuição F(x) = P(X x).Sorteio de 8 valores X ~ Normal ( = 10; 2 =
4)
10 ~ (0,1)2
XY N
2 10X Y 0,25
0,0
0,5
0,75
1,0
0 2 4-4 -2
P(Y
y
)
Y
Avaliação das SimulaçõesAvaliação das Simulações
• Estimação da Função de Probabilidade através das frequências relativas observadas (variáveis discretas)
• Métricas de tendência central e de dispersão:média, desvio padrão, mediana, quantis, amplitude, mínimo/máximo, etc
• Intervalos de Credibilidadeos limites são definidos, desprezando-se os valores extremos (mesma
proporção para ambos os lados)
• Box-plotmediana, 1o e 3o quartis e valores extremos (outliers)
BoxplotBoxplotÉ uma ótima alternativa para mostrar graficamente a dispersão de
observações de uma amostra e são muito úteis para comparar conjuntos de dados pois causam grande impacto visual e são fáceis de entender.
Há muitas variações de boxplot mas em geral representam:a)medianab)1o e 3o quartisc)mínimos e máximosd)“outliers”
Ex: amostra com 20 valores
0
20
40
60
80
100
120
DIQ (distância interquartil)
1,5*DIQ
1,5*DIQ
1o quartil
3o quartil
mediana
último pontosuperior
último pontoinferior
outliers1,5*DIQ
outliersextremos
BoxplotBoxplot
0
20
40
60
80
100
120
B C DA
a) qual é a distribuição mais simétrica?D
b) qual é a distribuição mais assimétrica?A
c) quais as 2 distribuições que mais se confundem entre si?A e B
d) quais as 2 distribuições que mais se distinguem entre si?B e C
Exemplos de AplicaçõesExemplos de Aplicações
Exemplo 1:estimar função de probabilidade de um experimento complexo (urnas)
Exemplo 2:simular a propagação de incertezas de uma equação não-linear (cond. hidráulica)
Exemplo 3:determinar o valor crítico de um teste estatístico (KS para duas amostras)
(ver Simulacao.xls)
Exemplo 1Exemplo 1I
A B
C
Etapas:I) Das urnas A e B, sorteia-se uma
bola de cada. As duas bolas são colocadas na urna C
Exemplo 1Exemplo 1
II
A B
C
Etapas:I) Das urnas A e B, sorteia-se uma
bola de cada. As duas bolas são colocadas na urna C
II)Da urna C, sorteiam-se duas bolas (sem reposição)
Exemplo 1Exemplo 1
bolas de mesma
cor?Sim Não
III
A B
C
Etapas:I) Das urnas A e B, sorteia-se uma
bola de cada. As duas bolas são colocadas na urna C
II)Da urna C, sorteiam-se duas bolas (sem reposição)
III)Se as bolas forem da mesma cor, ambas são colocadas na urna A. Caso contrário, ambas são colocadas na urna B
Exemplo 1Exemplo 1IV
Etapas:I) Das urnas A e B, sorteia-se uma
bola de cada. As duas bolas são colocadas na urna C
II)Da urna C, sorteiam-se duas bolas (sem reposição)
III)Se as bolas forem da mesma cor, ambas são colocadas na urna A. Caso contrário, ambas são colocadas na urna B
IV)Escolhe-se aleatoriamente a urna A ou B e dela retiram-se 5 bolas (sem reposição)
A B
CDefinindo-se X como o número de
bolas azuis nas 5 observações, qual a distribuição dos valores de X?
X FR0 8,62%1 45,73%2 39,92%3 5,03%4 0,70%5 0,00%
Exemplo 2Exemplo 2
Ks é a condutividade hidráulica saturada é a umidade volumétrica do solos é a umidade volumétrica do solo saturado
Cálculo da Condutividade Hidráulica do Solo (K)
A condutividade hidráulica K expressa a facilidade com que um fluido (água) é transportado através de um meio poroso (solo) e combina as propriedades do fluido e do meio
Exemplo 2Exemplo 2
2 3b
ss
K K
Cálculo da Condutividade Hidráulica do Solo (K)
Campbell (1974) formulou uma relação bastante prática para o cálculo da condutividade hidráulica:
Campbell, G.S. A simple method for determining unsaturated conductivity from moisture retention data. Soil Sci., 117(6):311-314, 1974.Clapp, R.B.; Hornberger, G.M. Empirical equations for some soil hydraulic properties. Water Resour. Res., 14(4):601-604, 1978.
Exemplo 2Exemplo 2
2 3b
ss
K K
Ks é a condutividade hidráulica saturada (mm/dia) é a umidade volumétrica do solo (cm3/cm3)s é a umidade volumétrica do solo saturado (cm3/cm3)b0 e b1 são coeficientes empíricosA é o teor de argila (g/g)
Cálculo da Condutividade Hidráulica do Solo (K)
0 1b b b A
20
21
~ ( 3,55; 0,0812)
~ ( 13,46; 0,7452)~ (0,1;0,6)/ ~ (0;1)
~ (100;500)S
s
b N
b NA U
UK U
Rawls, W.J.; Brakensiek, D.L.; Saxton, K.E. (1982). Estimation of soil water properties. Transaction of the ASAE, 25(5):1316-1320.
Rawl
s et
al.
(198
2)
Exemplo 2Exemplo 2
2 3b
ss
K K
Ks é a condutividade hidráulica saturada (mm/dia) é a umidade volumétrica do solo (cm3/cm3)s é a umidade volumétrica do solo saturado (cm3/cm3)b0 e b1 são coeficientes empíricosA é o teor de argila (g/g)
Cálculo da Condutividade Hidráulica do Solo (K)
0 1b b b A
20
21
~ ( 3,55; 0,0812)
~ ( 13,46; 0,7452)~ (0,1;0,6)/ ~ (0;1)
~ (100;500)S
s
b N
b NA U
UK U
Limite de Credibilidade de 95%
P(5,52.10-31 < K < 169,25) = 0,95
Obs: foram desconsideradas as correlações existentes entre as variáveis simuladas
Exemplo 3Exemplo 3
Região A Região B81 5678 5561 7689 5469 8358 9764 8584 6689 7883 8088 6156 6987 7195 5575 91
Exemplo: Um pesquisador deseja saber se duas regiões de uma mesma imagem apresentam a mesma distribuição de valores (desconhecida). Para testar esta hipótese, amostrou-se 15 pontos independentes de cada região. Os valores observados são apresentados na tabela abaixo. O que se conclui a partir destes valores?Valor FRAA FRAB |Dif|