K-najbliži sused Algoritam Student: Filip Petrović Profesor: Veljko Milutinović Data Mining u bežičnim senzorskim mrežama 1/1 2
Feb 22, 2016
K-najbliži susedAlgoritam
Student: Filip PetrovićProfesor: Veljko Milutinović
Data Mining
u bežičnim senzorskim mrežama
1/12
Bežične senzorske mreže: Šta čini jednu BSM?- Skup bežičnih senzora postavljenih u odredjenoj oblasti u cilju posmatranja, ispitivanja i prikljupljanja podataka od važnosti.
Slika br. 1 – Primer bežične senzorske mreže 2/12
Primena BSM-a: Praćenje zagadjenja vazduha- Zastupljeno u Londonu i Stokholmu
Sprečavanje šumskih požara- Merenje temperature, vlažnosti vazduha... Procena rizika
Prirodne nepogode i klizišta- Preventivno dejstvo, praćenje raznih parametara
Kvalitet vode- Postavlja se na reke, jezera, mora i okeane
Zdravstvo- praćenje raznih parametara, puls, otkucaji srca…
3/12
Zajednički problem:
Mogući uzroci gubljenja podataka: - Prepreke širenju signala (planine, gradjevine...)- Prirodne nepogode (grom, kiša, oluja)- Nestanak napajanja (mogu da nestanu i keširani podaci)- Fizička oštećenja
Zaključak:- Gubljenje podataka je neizbežno
Gubljenje podataka jednog ili više senzora- Usled raznih uzroka
4/12
Rešenje problema?
Aproksimiranje izgubljenih podataka- Izgubljeni podaci se ne smeju zanemariti
Izbor algoritma za aproksimiranje- Neki se oslanjaju na vremensku a neki na prostornu korelaciju
K – najbliži sused algoritam- Pored vremenske, oslanja se i na prostornu korelaciju
5/12
K – najbliži sused
Ni – Izgubljeni senzorski podaci senzora i.
m – broj senzora.
Nb(i) = {N1, N2 … Nm-1, Nm} – Skup svih suseda senzora i.
Šta ova činjenica omogućava?- primena modela linearne regresije
Slika br. 2 – Primer odziva dva senzora
∀ Nj Nb(i), Ni ∈ i Nj su prostorno relativno blizu (imaće sličan odziv)
6/12
Model linearne regresijeKoristi se za predikciju nepoznate, zavisne varijable(kada je poznata varijabla sa kojom je nepoznata varijabla u linearnoj vezi)
Yit = α + β*Yjt + μjt
Yit - podaci senzora Ni u trenutku t
Yjt - podaci senzora Nj u trenutku t
α, β – koeficijenti modela
μjt – slučajna greška u trenutku t
U skladu sa modelom linearne regresije,uzimamo podatke poznatih senzora,kako bismo izračunali približne koeficijente α’ i β’. 7/12
Model linearne regresijeTražena formula postaje:
Yit’ = α’ + β’*Yjt
Yit’ – procenjena vrednost podataka senzora
Kako bi rezultat bio što precizniji,
Za sve susede senzora Ni iz skupa Nb(i) možemo izračunati Yit’ ,zatim izračunati njihovu srednju ponderisanu vrednost.
Wj – Potrebno je još odrediti težinski koeficijent 8/12
Težinski koeficijentZašto težinski koeficijent?- Preciznije utvrdjena vrednost senzora mora imati veći uticaj na rezultat.
U tu svrhu se uvodi Koeficijent determinacije R2
- R2 (0 <= R2 <= 1) - veća vrednost, bolja procena.
Prema pomenutom modelu linearne regresije,traženi težinski koeficijent postaje:
Čime su ispunjeni svi usloviza procenu izgubljenih podataka senzora Ni.
Metoda K–najbliži sused je u praksi pokazala izuzetno dobre rezultate.9/12
Potpuni podaciNepotpuni podaci
Izgubljeni senzorski podaciRešenje?K-najbliži sused algoritam
Potpuni podaci
10/12
Slika br. 3 – Primer bežične senzorske mreže
11/12