K- najbli ži sused Algoritam

K-najbliži susedAlgoritam

Student: Filip PetrovićProfesor: Veljko Milutinović

Data Mining

u bežičnim senzorskim mrežama

1/12

Bežične senzorske mreže: Šta čini jednu BSM?- Skup bežičnih senzora postavljenih u odredjenoj oblasti u cilju posmatranja, ispitivanja i prikljupljanja podataka od važnosti.

Slika br. 1 – Primer bežične senzorske mreže 2/12

Primena BSM-a: Praćenje zagadjenja vazduha- Zastupljeno u Londonu i Stokholmu

Sprečavanje šumskih požara- Merenje temperature, vlažnosti vazduha... Procena rizika

Prirodne nepogode i klizišta- Preventivno dejstvo, praćenje raznih parametara

Kvalitet vode- Postavlja se na reke, jezera, mora i okeane

Zdravstvo- praćenje raznih parametara, puls, otkucaji srca…

3/12

Zajednički problem:

Mogući uzroci gubljenja podataka: - Prepreke širenju signala (planine, gradjevine...)- Prirodne nepogode (grom, kiša, oluja)- Nestanak napajanja (mogu da nestanu i keširani podaci)- Fizička oštećenja

Zaključak:- Gubljenje podataka je neizbežno

Gubljenje podataka jednog ili više senzora- Usled raznih uzroka

4/12

Rešenje problema?

Aproksimiranje izgubljenih podataka- Izgubljeni podaci se ne smeju zanemariti

Izbor algoritma za aproksimiranje- Neki se oslanjaju na vremensku a neki na prostornu korelaciju

K – najbliži sused algoritam- Pored vremenske, oslanja se i na prostornu korelaciju

5/12

K – najbliži sused

Ni – Izgubljeni senzorski podaci senzora i.

m – broj senzora.

Nb(i) = {N1, N2 … Nm-1, Nm} – Skup svih suseda senzora i.

Šta ova činjenica omogućava?- primena modela linearne regresije

Slika br. 2 – Primer odziva dva senzora

∀ Nj Nb(i), Ni ∈ i Nj su prostorno relativno blizu (imaće sličan odziv)

6/12

Model linearne regresijeKoristi se za predikciju nepoznate, zavisne varijable(kada je poznata varijabla sa kojom je nepoznata varijabla u linearnoj vezi)

Yit = α + β*Yjt + μjt

Yit - podaci senzora Ni u trenutku t

Yjt - podaci senzora Nj u trenutku t

α, β – koeficijenti modela

μjt – slučajna greška u trenutku t

U skladu sa modelom linearne regresije,uzimamo podatke poznatih senzora,kako bismo izračunali približne koeficijente α’ i β’. 7/12

Model linearne regresijeTražena formula postaje:

Yit’ = α’ + β’*Yjt

Yit’ – procenjena vrednost podataka senzora

Kako bi rezultat bio što precizniji,

Za sve susede senzora Ni iz skupa Nb(i) možemo izračunati Yit’ ,zatim izračunati njihovu srednju ponderisanu vrednost.

Wj – Potrebno je još odrediti težinski koeficijent 8/12

Težinski koeficijentZašto težinski koeficijent?- Preciznije utvrdjena vrednost senzora mora imati veći uticaj na rezultat.

U tu svrhu se uvodi Koeficijent determinacije R2

- R2 (0 <= R2 <= 1) - veća vrednost, bolja procena.

Prema pomenutom modelu linearne regresije,traženi težinski koeficijent postaje:

Čime su ispunjeni svi usloviza procenu izgubljenih podataka senzora Ni.

Metoda K–najbliži sused je u praksi pokazala izuzetno dobre rezultate.9/12

Potpuni podaciNepotpuni podaci

Izgubljeni senzorski podaciRešenje?K-najbliži sused algoritam

Potpuni podaci

10/12

Slika br. 3 – Primer bežične senzorske mreže

11/12

Student: Filip Petrović

e-mail: [email protected]

br. indeksa: 3029/2013

12/12

K- najbli ži sused Algoritam

Documents