2010-11-15 1 „STATYSTYKA” Seminarium – Chemia Analityczna Dr hab inż Piotr Konieczka 1 Dr hab. inż. Piotr Konieczka e-mail: [email protected]• Dokładność (accuracy) – stopień zgodności uzyskanego wyniku pojedynczego pomiaru z wartością oczekiwaną (rzeczywistą). • Poprawność (prawdziwość) (trueness) – stopień zgodności wyniku oznaczenia (obliczonego na podstawie serii pomiarów) z wartością oczekiwaną. • Precyzja (precision) – stopień zgodności między niezależnymi wynikami uzyskanymi w trakcie analizy 2 danej próbki z zastosowaniem danej procedury analitycznej.
22
Embed
statystyka seminarium2010 [tryb zgodności] - chem.pg.edu.pl · „STATYSTYKA” Seminarium – Chemia Analityczna Dr hab inżPiotr Konieczka 1 Dr hab. in . Piotr Konieczka e-mail:
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
• Dokładność (accuracy) – stopień zgodnościuzyskanego wyniku pojedynczego pomiaru zwartością oczekiwaną (rzeczywistą).
• Poprawność (prawdziwość) (trueness) – stopieńzgodności wyniku oznaczenia (obliczonego napodstawie serii pomiarów) z wartością oczekiwaną.
• Precyzja (precision) – stopień zgodności międzyniezależnymi wynikami uzyskanymi w trakcie analizy
2
y y y y ydanej próbki z zastosowaniem danej proceduryanalitycznej.
2010-11-15
2
Miarą powtarzalności, precyzji pośredniej i odtwarzalnościmoże być wartość odchylenia standardowego, względnegoodchylenia standardowego lub tzw. współczynnika zmienności.
Odchylenie standardowe jest definiowane jako miararozproszenia uzyskanych poszczególnych wartości oznaczeńrozproszenia uzyskanych poszczególnych wartości oznaczeńwokół wartości średniej i opisywane jest przez poniższązależność:
11
2
n
xxs
n
iśri
3
1ngdzie:
xi – wartość pojedynczego wyniku oznaczenia,xśr – średnia arytmetyczna z uzyskanych wyników,n – liczba uzyskanych wyników,
Niepewność a przedział ufności
W niektórych przypadkach wartość niepewności może byćszacowana jako przedział ufności. Podstawową zasadą prawaprzenoszenia (propagacji) jest uwypuklenie wpływu udziałuwielkości o najwyższej wartości. Dlatego też, jeżeli jakiś zparametrów ma dominujący wpływ w tworzonym budżecieparametrów ma dominujący wpływ w tworzonym budżecieniepewności można szacowanie niepewności ograniczyć jedyniedo jej obliczania na podstawie wielkości tegoż parametru.
4
2010-11-15
3
W przypadku, gdy powtarzalność pomiarów jest tymdominującym parametrem to wielkość rozszerzonejniepewności pomiaru może być obliczana w oparciu ozależność:
nskU n
Z drugiej strony obliczona wartość przedziału ufności dla serii wyników opisywana jest przez zależność:
nsftxśr ),(
5
Wartość współczynnika rozszerzenia k dla poziomu istotności = 0,05 wynosi k = 2. Z kolei dla poziomu istotności = 0,05 i liczby stopni swobody f →∞, wartość parametru t ≈ 2.
p y ą p ą p ą ( y )analiz dla próbek o różnej zawartości analitu,
s1
s2
6
np.: wykonanie analiz dla tej samej próbki (taka sama wartość oczekiwana) dwiema niezależnymi procedurami (różne wartości odchyleń standardowych),
s1
μ1 = μ2
2010-11-15
4
cel porównanie wartości odchyleń standardowych
(wariancji) dla dwóch zbiorów wyników
test F-Snedecora
hipotezy Ho – obliczone wartości wariancji dla
porównywanych serii wyników nie różnią się w
sposób statystycznie istotny
H1 – obliczone wartości wariancji dla
7
H1 obliczone wartości wariancji dla
porównywanych serii wyników różnią się w
sposób statystycznie istotny
wymagania rozkłady normalne wyników w serii
test F-Snedecora
Sposób postępowania:
• obliczyć wartości odchyleń standardowych dla serii wynikówuzyskanych obydwiema procedurami (s1 i s2),
• obliczyć wartość parametru testu F-Snedecora wg wzoru:
21
1
1
1s
nn
F
8¡ F > 1 zawsze!!!
22
2
2
1s
nn
F
2010-11-15
5
• z tabeli rozkładu testu F-Snedecora wyszukać wartośćparametru Fkr dla przyjętego poziomu istotności -
ś
test F-Snedecora
(najczęściej = 0,05) oraz wyliczonych liczb stopniswobody f1 i f2 (gdzie f1 =n1-1 i f2 =n2-1 a n1 i n2 toliczba wyników uzyskanych z zastosowaniem obydwuprocedury),
porównać wartość F z wartością F
9
• porównać wartość F z wartością Fkr ,
PrzykładOznaczano zawartość HCl z zastosowaniem dwóch technikanalitycznych: kulometrycznej i konduktometrycznej. Sprawdzić,czy obliczone wartości odchyleń standardowych dla uzyskanychtymi procedurami serii pomiarowych różnią się między sobą w
Ponieważ F < Fkr zatem wynika stąd wniosek, że uzyskane wartościodchyleń standardowych nie różnią się między sobą w sposób statystycznieistotny (porównywane procedury nie różnią się pod względem precyzji).
1. dokładność wyniku pojedynczego oznaczenia (DOKŁADNOŚĆ):
2. dokładność wyniku analizy (POPRAWNOŚĆ/PRAWDZIWOŚĆ):
iisystxix xxxxi
śrsystxśrx xxxś
14
3. dokładność procedury analitycznej:
śrsystxśrx śr
systxmetx xxEmet
)(
2010-11-15
8
test Q-Dixona
cel sprawdzenie, czy w danym zbiorze wyników nie ma wyniku
obarczonego błędem grubymg ę g y
hipotezy Ho – w zbiorze wyników brak obarczonego błędem grubym
H1 – w zbiorze wyników znajduje się wynik obarczony
błędem grubym
wymagania liczność zbioru 3 – 10
15
z danego zbioru można odrzucić tylko jeden wynik
test Q-DixonaSposób postępowania• uszeregować wyniki w ciąg niemalejący,
• obliczyć wartość rozstępu R zgodnie ze wzorem:
R 1xxR n
R
xxQ 12
1
R
xxQ nnn
1
• obliczyć parametry Q1 i Qn wg wzorów:
• porównać otrzymane wartości z wartością krytyczną Qkr,
16
Stosując test Q-Dixona można z danej serii odrzucić tylko jeden wynik obarczony błędem grubym
• jeśli, któryś z obliczonych parametrów przekracza wartość krytyczną Qkrto wynik na podstawie, którego został obliczony (xn lub x1) należyodrzucić jako obarczony błędem grubym i policzyć wartości xśr i s,
2010-11-15
9
Przykład
Wyniki oznaczeń zawartości jonów miedzi (Cu2+) w próbceścieków [mg/dm3]:
Ponieważ Q1 > Qkr wynik najmniejszyw serii należy z niej odrzucić jakoobarczony błędem grubym.
2010-11-15
10
test t-Studenta
cel porównanie wartości średnich dla dwóch serii (zbiorów)
wyników
hipotezy Ho – obliczone wartości średnie dla porównywanych serii p y o p y y
wyników nie różnią się w sposób statystycznie istotny
H1 – obliczone wartości średnie dla porównywanych serii
wyników różnią się w sposób statystycznie istotny
wymagania rozkłady normalne wyników w serii
19
wymagania rozkłady normalne wyników w serii
liczności wyników w każdej serii zbiorów większe od 2
nieistotność różnic wariancji dla porównywanych zbiorów
wyników – test F-Snedecora
Porównanie dokładności dwóch procedur (wartości średnich)
Jeżeli porównywane procedury nie różnią się w sposób statystycznieistotny pod względem precyzji (stosujemy w tym celu test F-
test t-Studenta
y p g ę p y j ( j y ySnedecora) ich dokładność porównujemy stosując test t-Studenta.
Sposób postępowania:
• obliczyć wartości średnie i wartości odchyleń standardowych dla serii wyników uzyskanych porównywanymi procedurami,
• obliczyć wartość parametru t wg wzoru:
20
• obliczyć wartość parametru t wg wzoru:
21
2121
222
211
21 2
11 nnnnnn
snsn
xxt śrśr
2010-11-15
11
test t-Studenta
W przypadku, gdy liczebności serii pomiarów dla obu procedur sąjednakowe powyższy wzór upraszcza się do postaci:
nss
xxt śrśr
22
21
21
21
• porównać wartość obliczonego parametru t z wartościąkrytyczną tkr z tablic rozkładu t-Studenta dla przyjętegopoziomu istotności – oraz liczby stopni swobody f = n1+n2-2
Ponieważ F < Fkr zatem wynika stąd wniosek, że porównywane procedurynie różnią się między sobą, w sposób statystycznie istotny, pod względemprecyzji.
2010-11-15
13
Porównanie (POPRAWNOŚCI) dokładności - test t-Studentaponieważ liczebności serii pomiarów dlaobu procedur są jednakowe parametr tobliczono w oparciu o poniższy wzór:
Ponieważ t > tkr zatem wynika stąd wniosek,że porównywane procedury różnią się podwzględem dokładności (POPRAWNOŚCI).
Jeżeli porównywane procedury różnią się w sposób statystycznieistotny pod względem precyzji (stosujemy w tym celu test F-Snedecora) ich dokładność (POPRAWNOŚĆ) porównujemy stosującSnedecora) ich dokładność (POPRAWNOŚĆ) porównujemy stosującprzybliżony test C-Cochrana i Coxa - serie mało liczne lub test Aspin iWelcha.
26
2010-11-15
14
test C- Cochrana i Coxa
cel porównanie wartości średnich dla serii zbiorów wyników, dla
których wartości odchyleń standardowych (wariancji) różnią
i ób t t t i i t tsię w sposób statystycznie istotny
hipotezy Ho – obliczone wartości średnie dla porównywanych serii
wyników nie różnią się w sposób statystycznie istotny
H1 – obliczone wartości średnie dla porównywanych serii
27
wyników różnią się w sposób statystycznie istotny
wymagania rozkład normalny wyników w serii
liczność wyników w serii zbiorów większa od 2
test C- Cochrana i Coxa
Sposób postępowania:
• obliczyć wartości średnie i wartości odchyleń standardowych dla serii wyników uzyskanych porównywanymi procedurami,
• obliczyć wartość parametru C wg wzoru:
21
21
zz
xxC śrśr
28
11
21
1 n
sz
12
22
2 n
sz
gdzie:
2010-11-15
15
• obliczyć wartość krytyczną parametru Ckr wg wzoru:
2211 tztzC
test C- Cochrana i Coxa
21
2211
zzCkr
gdzie:
t1 i t2 wartości krytyczne odczytane z tabeli rozkładu t-Studentaodpowiednio dla f1=n1-1 i f2=n2-1 stopni swobody oraz poziomu istotności ,
29
• porównać wartość krytyczną parametru Ckr z wartością obliczoną C,
Przeprowadzono analizę zawartości wody w herbacie (suchej oczywiście)przez dwa laboratoria. Sprawdzić czy wyniki uzyskane przez te laboratoriaróżnią się pod względem dokładności (POPRAWNOŚCI).
Uzyskane wyniki:
Przykład test F-Snedecora
Laboratorium 1. Laboratorium 2.
s = 0,036 g/kg s = 0,018 g/kgxśr = 1,35 g/kg xśr = 1,41 g/kg
Porównanie precyzji - test F-Snedecora
n = 8 n = 8
30
s1 , xśr1 s2 , xśr2
00,422
21 s
sF
2010-11-15
16
f1
f2
2 3 4 5 6 7 8 9 10 11
2 19,0099,01
19,1699,17
19,2599,25
19,3099,30
19,3399,33
19,3699,34
19,3799,36
19,3899,38
19,3999,40
19,4099,41
3 9,5530,81
9,2829,46
9,1228,71
9,0128,24
8,9427,91
8,8827,67
8,8427,49
8,8127,34
8,7827,23
8,7627,13
4 6,9418,00
6,5916,69
6,3915,98
6,2615,52
6,1615,21
6,0914,98
6,0414,80
6,0014,66
5,9614,54
5,9314,45
5 5,793 2
5,412 06
5,1939
5,050 9
4,950 6
4,880
4,820 2
4,780
4,740 0
4,709 96
Test F-Snedecora – wartości krytyczne
Z tablicy rozkładuF-Snedecoraodczytano wartość Fkrdla danego poziomuistotności iodpowiednich liczb
Wniosek taki jak w przypadku zastosowania testu Cochrana i Coxa
Porównanie wartości średniej z wartością oczekiwaną
test t-Studenta
cel porównanie wartości średniej z założoną wartością
ść ś ó óhipotezy Ho – obliczona wartość średnią nie różni się w sposób
statystycznie istotny od wartości założonej
H1 – obliczona wartość średnią różni się w sposób
statystycznie istotny od wartości założonej
38
wymagania rozkład normalny wyników w serii
liczność wyników w serii zbiorów większa od 2
2010-11-15
20
Sposób postępowania:
• dla uzyskanej badaną metodą serii wyników obliczyć należy (po
test t-Studenta
dla uzyskanej badaną metodą serii wyników obliczyć należy (powyeliminowaniu ewentualnych wyników obarczonych błędami grubymi)wartość średnią i wartość odchylenia standardowego,
• obliczyć wartość parametru t wg wzoru:
nx
t xśr
39
s
• porównać wartość obliczonego parametru t z wartością krytyczną tkr ztablic rozkładu t-Studenta dla przyjętego poziomu istotności – ,
ponieważ t > tkr , należy wnioskować, że otrzymana wartość średnia różni się w sposób statystycznie istotny od wartości certyfikowanej.
Nie brano tu jednak pod uwagę wartości niepewności wyznaczenia wartości certyfikowanej.
2010-11-15
22
ns
xt xśr
xt xśr
test t-Studenta
n
st
śrx
xśr
u
xt
43
22x
xśr
xśruu
xt
ZADANIE
Wpisać na listę!!!! seria 1 seria 21 6,13 6,222 6,27 6,663 6,08 6,434 6,11 6,115 6,72 6,016 6,19 6,95
Lp.zawartość Mg2+ [mg/dm3]
zestaw 1
7 6,32 6,788 6,20 6,17
wartość oczekiwana 6,20
Dla podanych serii wyników oznaczeń:1.sprawdzić, czy w seriach nie ma wyników obarczonych błędami grubymi – test Q-Dixona;2.obliczyć wartości średnie i wartości odchylenia standardowego;3.porównać uzyskane wyniki pod względem precyzji – test F-Snedecora4.porównać uzyskane wyniki pod względem poprawności – test t-Studenta lub test C
44
Cochrana i Coxa czy test Aspin i Welcha5.porównać wyniki z wartością oczekiwaną – test t-Studenta6.zapisać wyniki – wartość ± rozszerzona niepewność dla k=2; uwzględnić tylko