-
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
ECO-STATISTICA: OBIECTIVE: A. EVALUAREA CELEI MAI PROBABILE
VALORI A UNEI CARACTERISTICI A MEDIULUI IN ZONA INVESTIGATA si a
ERORII DE ESTIMARE
In zona investigata cu o probabilitate de 90% (riscul asumat
alfa =10%)
presiunea este cuprinsa in intervalul:
771,444-0.011 mmHg 771,444+0.011 mmHg
B. EVALUAREA CORELATIILOR DINTRE VALORILE CARACTERISTICILOR
MEDIULUI
Presiunea = -6.467* Temperatura + 890.9 Coeficient de corelatie:
-0.89028
C. EVALUAREA CELEI MAI PROBABILE VALORI A UNEI CARACTERISTICI A
MEDIULUI INTR-UN ANUMIT PUNCT AL ZONEI INVESTIGATE
Titlu diagram
y = -6.467x + 890.9
700.00
720.00
740.00
760.00
780.00
800.00
820.00
840.00
0.00 5.00 10.00 15.00 20.00 25.00 30.00temperatura
pres
iun
e
presiunea-temperaturaLiniar (presiunea-temperatura)
-
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
1. EVALUAREA CELEI MAI PROBABILE VALORI A UNEI CARACTERISTICI A
MEDIULUI IN ZONA INVESTIGATA si a ERORII DE ESTIMARE care depinde
de
a. Densitatea punctelor de observatie b. Variabilitatea
caracteristicii studiate c. Riscul asumat
Ex.: CONTINUTUL DE HUMUS DIN SOL IN PADUREA BANEASA este de
250ppm PLUS /MINUS 15ppm cu un RISC DE 10%.
V+/-EROARE T=10GRADE Celsius+/-2 grade Celsius
-
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
DATELE UTILIZATE PENTRU PRELUCRARI STATISTICE
Variabile/caracteristici ALFANUMERICE Ex.: LITOLOGIA: GRANIT,
BAZALT,.... Pentru valorile alfanumerice operatiile posibile in
cadrul prelucrarilor statistice sunt:
COMPARAREA (identice sau diferite) CONCATENAREA (alaturarea
celor doua valori)
Pentru prelucrari suplimentare, valorile alfanumerice se
codifica BINAR utilizand doua cifre:
0 (zero) care semnifica absenta valorii alfanumerice
1 (unu) care semnifica prezenta valorii alfanumerice
Variabile/caracteristici NUMERICE Ex.: TEMPERATURA: 100C, 150C,
... PRESIUNEA: 760 mm colHg
-
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
ETAPELE PRELUCRARILOR STATISTICE
1. ANALIZA VARIABILITATII GLOBALE (A.V.G)
DATELE UTILIZATE: VALORILE variabilelor/caracteristicilor
mediului: v(i); i=1,2,...n OBIECTIVUL: cea mai probabila valoare a
caracteristicii studiate si eroarea de estimare a acestei
valori
( )v
( )%10210 00 CC
-
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
PRELUCRAREA DATELOR ALFANUMERICE
Cea mai simpla varianta de evaluare a celei mai probabile valori
alfanumerice se bazeaza pe HISTOGRAMA NOMINALA.
Frecventa absoluta a valorilor
alfanumerice
Valorile alfanumerice intr-o succesiune arbitrara
arin salcie ?
-
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
PRELUCRAREA DATELOR NUMERICE a) Analiza valorilor extreme
conduce la doua variante
decizionale: a. Eliminarea: daca numarul valorilor extreme
este
redus b. Prelucrarea separata a grupului de valori
extreme: daca grupul este numeros.
Eliminarea valorilor extreme conduce la reducerea marimii erorii
de estimare pentru cea mai probabila valoare a
caracteristicii studiate in zona investigata.
Aplicatie temperatura Tema T7:
Nr.valorii
Valoarea variabilei
-
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
Din diagrama de variabilitate a temperaturii rezulta ca nu sunt
valori extreme care sa fie eliminate din setul de date original. In
continuare se vor prelucra toate cele 40 de valori disponibile.
b) Analiza distributiei valorilor de temperatura utilizand
HISTOGRAMA VALORILOR TEMPERATURII
Normalitatea unei distributii (simetria histogramei) se
cuantifica prin COEFICENTUL DE ASIMETRIE:
ZERO cand histigrama este SIMETRICA NEGATIV daca asimetria este
de STANGA POZITIV daca asimetria este de DREAPTA
Dupa aplicarea transformarilor radical (valmax+1-v) si 1/v s-a
decis sa se calculeze valoarea cea mai probabila cu valorile
netrensformate ale temperaturii deoarece coeficientul de asimetrie
corespunzator valorilor originale este cel mai mic: -0,27.
c) calculul valorii celei mai probabile si a erorii de estimare
a acesteia pentru un risc asumat de 10%.
F.abs.T
T
Vmin VMAX
-
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
LABORATOR 1. 1.Crearea fisierului cu date:
Date numerice: o Coordonatele punctelor de masura (x,y) [m] o
Presiunea aerului [mmHg] o Temperatura aerului [oC]
Date alfanumerice: o Litologia: granit, diorit
2. Construirea diagramei de variabilitate pentru identificarea
valorilor EXTREME
c) Evaluarea distributiei valorilor caracteristicilor
numerice
Instrumentul utilizat: HISTOGRAMA
V Vmin Vmax
Frecventa absoluta
D n1=2 n2=4
n3=3 n4=1 0
1
2
3
4
-
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
Frecventa absoluta: numarul de aparitii al unei valori
in
Amplitudinea selectiei de valori:
minmax VVA =
Interval de grupare (STURGESS):
)ln(33,21 nAD
+=
Utilizarea HISTOGRAMEI pentru studiul distributiei valorilor
In functie de tipul HISTOGRAMEI se stabileste modul de calcul al
celei mai probabile valori din zona investigata:
-
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
Tipuri de HISTOGRAME: si modul de prelucrare specific
HISTOGRAMA UNIMODALA SI SIMETRICA
DISTRIBUTIA VALORILOR ESTE NORMALA
Valoarea cea mai probabila se calculeaza cu toate valorile
utilizate pentru constructia histogramei
HISTOGRAMA ESTE UNIMODALA SI ASIMETRICA
Valoarea cea mai probabila se calculeaza cu toate valorile
utilizate pentru constructia histogramei DAR
-
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
NORMALIZATE CU AJUTORUL UNOR FUNCTII ANALITICE ELEMENTARE (ex.:
log(v)=t)
DACA NU SE NOMRALIZEAZA DISTRIBUTIA VALORILOR , VALOAREA CEA MAI
PROBABILA
VA FI SUPRAESTIMATA/SUBESTIMATA IN FUNCTIE DE TIPUL DE ASIMETRIE
(DE DREAPTA
respectiv de STANGA)
HISTOGRAMA BIMODALA SIMETRICA `
Selectia de valori este NEOMOGENA si pentru prelucrare valori
sunt separate in doua grupuri OMOGENE pentru care se calculeaza
valori diferite ale celei mai probabile valori CU VALORILE
ORIGINALE
-
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
HISTOGRAMA BIMODALA ASIMETRICA
Selectia de valori este NEOMOGENA si pentru prelucrare valori
sunt separate in doua grupuri OMOGENE pentru care se calculeaza
valori diferite ale celei mai probabile valori CU VALORILE
ORIGINALE NORMALIZATE.
-
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
CALCULUL CELEI MAI PROBABILE VALORI DIN ZONA INVESTIGATA
Cea mai PROBABILA valoarea a unui set de valori cu distributie
NORMALA (HISTOGRAMA UNIMODALA-SIMETRICA) este MEDIA ARITMETICA A
VALORILOR.
n
v
v
ni
ii
=
=
=1
Daca distributia valorilor este NON-NORMALA (HISTOGRAMA este
ASIMETRICA) valoarea cea mai probabaila calculata cu formula MEDIEI
ARITMETICE va fi SUBESTIMATA/SUPRAESTIMATA in functie de tipul de
asimetrie. Pentru eliminaea SUPRAESTIMARII/SUBESTIMARII celei mai
probabile valori se NORMALIZEAZA distributia valorilor.
-
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
APLICATIE Calculul celei mai probabile valori a PRESIUNII in
zona investigata. Etapele de prelucrare (dupa construirea
histogramei):
1) Evaluarea tipului de histograma: a. Unimodala b.
Asimetrica
i. de stanga ii. moderata
2) Calculul mediei aritmetice a valorilor presiunii
(nenormalizate), media care va subestima cea mai probabila valoare
a presiunii.
3) Normalizarea distributiei valorilor a. Transformarea
valorilor folosind functia
RADICAL de ordinul 2
nivt ii ,...,2,1;2 ==
b. Construirea histogramei cu valorile transformate c.
Compararea histogramelor construite cu valorile
originale si cu valorile transformate: i. Calitativ/vizual
(aproximativ)
ii. Cantitativ pe baza coeficientului de asimetrie (SKEWNESS)
care este:
1. ZERO pentru histograma SIMETRICA 2. NEGATIV pt.hist. asim.
STANGA 3. POZITIV pt.hist.asim. DREAPTA
4) Calculul mediei cu valorile transformate, daca distributia
acestora are un coeficient de asimetrie mai mic decat al valorilor
originale.
mmHgv 444,771=
-
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
2. Calculul erorii de estimate a mediei cu formula:
( ) Hg0.011443mm),2
1( == tn
s
( )Hg0.164949mm
11
2
=
=
=
=
n
vv
s
ni
ii
CONCLUZIA analizei variabilitatii globale
In zona investigata valoarea cea mai probabila a presiunii este
771,444 mmHg cu o eroare de estimare de 0,011443 mmHg in conditiile
unui risc asumat de 10%.
presiunea
Probabilitatea de aparitie
a valorii
771,44mmHg
0,014 0,014
-
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
EVALUAREA CORELATIILOR DINTRE VALORILE CARACTERISTICILOR
MEDIULUI
Metodologia de evaluare a corelatiilor dintre caracteristicile
mediului (numerice/alfanumerice) este constituita din urmatoarea
succesiune de prelucrari:
Identificarea corelatiei dintre variabilele selectate (exista
corelatie in C1 si C2) prin metode grafice.
Evaluarea intensitatii corelatiei dintre cele doua variabile
selectate: o Standardizarea variabilitatii celor doua variabile
selectate pe domeniul valoric [0,1] o Calculul coeficientilor de
corelatie dintre cele
doua variabile selectate; Coeficientul de corelatie lineara
PEARSON
C1
C2
C1
C2
-
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
Val minima: -1: indica o corelatie lineara perfecta de tip
INVERS PROPORTIONAL.
Val medie: 0: indica lipsa corelatiei lineare dintre cele doua
variabile selectate
Valoarea MAXIMA: +1 indica o corelatie lineara perfecta de tip
DIRECT PROPORTIONAL
Modelarea matematica a corelatiei dintre cele doua variabile
selectate
21 CbaC +=
r = -1 r = 0 r = +1 C1 C1 C1
C2 C2 C2
a
C1
C2
1C
2C
21
CCb
=
-
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
LABORATOR Se evalueaza/analizeaza corelatia dintre:
PRESIUNE si TEMPERATURA
1. Identificarea corlatiei: a. Realizarea diagramei de
corelatie:
EXISTA CORELATIE 2. Evaluarea intensitatii
STANDARDIZAREA DIAGRAMA DE CORELATIE CU VALORILE
STANDARDIZATE
CALCULUL COEFICIENTULUI PEARSON: -0,89
INTENSITATEA CORELATIEI INVERSE DINTRE PRESIUNE SI TEMPERATURA
ESTE F.BUNA!
3. Modelarea MATEMATICA a corelatiei dintre PRESIUNE si
TEMPERATURA:
-
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
C. EVALUAREA CELEI MAI PROBABILE VALORI A UNEI CARACTERISTICI A
MEDIULUI INTR-UN ANUMIT PUNCT AL ZONEI INVESTIGATE
DATELE NECESARE Coordonatele punctelor de observatie: Xi,Yi
;
i=1,2,...,n Valorile variabilei cercetate in toate punctele
de
observatie disponibile: Vi; i=1,2,...,n
APLICATIA: DATELE utilizate sunt:
n =40 puncte de observatie Variabilele investigate:
o Alfanumerica: LITOLOGIA cu 2 valori distincte: Calcar
Argila
o Numerica: Presiunea [mmHg] Temperatura [oC]
METODOLOGIA DE EVALUARE 1. ANALIZA VARIABILITATII GLOBALE are ca
obiectiv evaluarea celei mai probabile valori a variabilei in zona
investigata. APLICATIA:
Evaluarea celei mai probabile valori a LITOLOGIEI in zona
investigata.
-
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
2. ANALIZA VARIABILITATII SPATIALE a variabilelor
investigate
OBIECTIV: identificare LEGII DE VARIATIE SPATIALA variabilelor
investigate ( )yxfV ,=
?????
APLICATIA: Lege de variatie spatiala pentru
Variabila alfanumerica (LITOLOGIA) Variabile numerica
(presiunea/temperatura)
3. EVALUAREA VALORII VARIABILEI IN ORICE PUNCT DIN DOMENIUL
INVESTIGAT
APLICATIA: Evaluarea:
Pentru LITOLOGIE Pentru presiune/temperatura
4. EVALUAREA ERORII DE ESTIMARE A VARIABILEI IN ORICE PUNCT DIN
DOMENIUL INVESTIGAT.
-
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
PROGRAMUL SURFER: Realizeaza doua tipuri de fisiere:
i. Worksheet (similare cu fisierele de tip excel) ii.
Plot-pentru reprezentari grafice si aplicarea
metodologiei de evalure a distributiei spatiale.
APLICATIA: Evaluarea celei mai probabile valori a
LITOLOGIEI in zona investigata.
INSTRUMENTUL UTILIZAT: HISTOGRAMA NOMINALA REZULTAT:
PROBABILITATE DE APARITIE CALCAR: 20/40*100=50%
PROBABILITATE DE APARITIE ARGILA: 20/40*100=50%
VALORILE ALFANUMERICE
FRECVENTA ABSOLUTA
-
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
APLICATIA: Lege de variatie spatiala pentru
Variabila alfanumerica (LITOLOGIA) Variabile numerica
(presiunea/temperatura)
Metodologia de lucru Reprezentarea distributiei spatiale a
punctelor de
observatie (SURFER< datele din fisierul excel: sheet:
datasurfer (x,y pentru cele 40 de puncte de observatie)
File+new Plot+Map+New+Post Map+ Evaluarea legii de variatie
spatiala a variabilei
alfanumerice:LITOLOGIE cu doua valori distincte: 1. argila
codificarea binara a valorii argilei calculul variogramei
experimentale
omnidirectionale
NOTA_CURS
VARIOGRAMA EXPERIMENTALA (V.E.)-forma de exprimare sintetica a
legii de variatie spatiala pentru caracteristicile alfanumerice si
numerice. DATELE NECESARE pentru calculul V.E. sunt:
coordonatele punctelor de observatie (x,y)
valorile caracteristicii: o 0/1 pentru cele alfanumerice o
Valorile pentru cele numerice
-
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
FORMULA DE CALCUL pentru V.E.
( ) ( ) ( )( )
=
dN
ji vvdNd
r
rr
1
2
21
Calculul variogramei experimentale cu prg.SURFER 1. CREAREA UNUI
FISIER DE TIP: PLOT File+New+Plot 2. LANSAREA PROGRAMULUI DE
CALCUL
AL VARIOGRAMEI Grid+Variogram+New Variogram 3. Selectarea
fisierului cu date 4. Selectarea datelor: x, y, Cod_argila 5.
Calculul si salvarea variogramei pentru
argila:Variograma_ARGILA. 6. Calculul variogramei pentru
calcar:
Variograma_CALCAR OBSERVATIE:
dr
( )dr
-
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
Daca sunt doar DOUA valori alfanumerice DISTINCTE variogramele
sunt identice pentru aceste valori. Variogramele pentru
variabile/caracteristici ALFANUMERICE se numesc VARIOGRAME
INDICATOARE
7. Calculul variogramei experimentale pentru variabilele
numerice:
Presiune: Variograma_PRESIUNE
MODELAREA MATEMATICA A VARIOGRAMEI EXPERIMENTALE consta in
identificarea unei functii continui care interpoleaza cu abateri
minime valorile variogramei experimentale
1. modelarea matematica a Variogramei ARGILEI 2. etc.
EVALUAREA DISTRIBUTIEI SPATIALE PENTRU VARIABILELE
ALFANUMERICE
NOTA CURS: Harta distributiei spatiale a variabilelor
ALFANUMERICE este o harta cu distributia PROBABILITATII DE
APARIATIE a valorii afanumerice studiate (ARGILA). De regula pe
aceste harti se reprezinta numai zonele cu probabilitati mai mari
de 50%.
o Aplicatia: Reteaua de interpolare pentru probabilitatea
de aparitie a argilei (GRID_ARGILA)
-
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015
Reprezentarea grafica a distributiei spatiale a probabilitatilor
de aparitie pentru ARGILA
Definitivarea reprezentarii grafice