Top Banner
First Prev Next Last Go Back Full Screen Close Quit Konwersatorium – Matematyczne Metody Ekonomii narzędzia matematyczne w eksploracji danych Alorytmy klasyfikujące w oparciu o przyklady k -NN i jego rozszerzenia Wyklad 9 Marcin Szczuka http://www.mimuw.edu.pl/szczuka/mme/
19

k-NN i jego rozszerzeniaszczuka/mme/wyklad9.pdf · •First •Prev •Next •Last •Go Back •Full Screen •Close •Quit Plan wykładu • Klasyfikacja oparta na podobieństwie.

Feb 28, 2019

Download

Documents

dinhhanh
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: k-NN i jego rozszerzeniaszczuka/mme/wyklad9.pdf · •First •Prev •Next •Last •Go Back •Full Screen •Close •Quit Plan wykładu • Klasyfikacja oparta na podobieństwie.

•First •Prev •Next •Last •Go Back •Full Screen •Close •Quit

Konwersatorium – Matematyczne Metody Ekonomiinarzędzia matematyczne w eksploracji danych

Alorytmy klasyfikującew oparciu o przykładyk-NN i jego rozszerzenia

Wykład 9Marcin Szczuka

http://www.mimuw.edu.pl/∼szczuka/mme/

Page 2: k-NN i jego rozszerzeniaszczuka/mme/wyklad9.pdf · •First •Prev •Next •Last •Go Back •Full Screen •Close •Quit Plan wykładu • Klasyfikacja oparta na podobieństwie.

•First •Prev •Next •Last •Go Back •Full Screen •Close •Quit

Dobry sąsiad to bezcenny skarb.

przysłowie chińskie

Page 3: k-NN i jego rozszerzeniaszczuka/mme/wyklad9.pdf · •First •Prev •Next •Last •Go Back •Full Screen •Close •Quit Plan wykładu • Klasyfikacja oparta na podobieństwie.

•First •Prev •Next •Last •Go Back •Full Screen •Close •Quit

Plan wykładu

• Klasyfikacja oparta na podobieństwie.• Algorytm k-NN.• Usprawnienia k-NN.• Aproksymacja funkcji z k-NN.

Page 4: k-NN i jego rozszerzeniaszczuka/mme/wyklad9.pdf · •First •Prev •Next •Last •Go Back •Full Screen •Close •Quit Plan wykładu • Klasyfikacja oparta na podobieństwie.

•First •Prev •Next •Last •Go Back •Full Screen •Close •Quit

Page 5: k-NN i jego rozszerzeniaszczuka/mme/wyklad9.pdf · •First •Prev •Next •Last •Go Back •Full Screen •Close •Quit Plan wykładu • Klasyfikacja oparta na podobieństwie.

•First •Prev •Next •Last •Go Back •Full Screen •Close •Quit

Page 6: k-NN i jego rozszerzeniaszczuka/mme/wyklad9.pdf · •First •Prev •Next •Last •Go Back •Full Screen •Close •Quit Plan wykładu • Klasyfikacja oparta na podobieństwie.

•First •Prev •Next •Last •Go Back •Full Screen •Close •Quit

Page 7: k-NN i jego rozszerzeniaszczuka/mme/wyklad9.pdf · •First •Prev •Next •Last •Go Back •Full Screen •Close •Quit Plan wykładu • Klasyfikacja oparta na podobieństwie.

•First •Prev •Next •Last •Go Back •Full Screen •Close •Quit

Page 8: k-NN i jego rozszerzeniaszczuka/mme/wyklad9.pdf · •First •Prev •Next •Last •Go Back •Full Screen •Close •Quit Plan wykładu • Klasyfikacja oparta na podobieństwie.

•First •Prev •Next •Last •Go Back •Full Screen •Close •Quit

Page 9: k-NN i jego rozszerzeniaszczuka/mme/wyklad9.pdf · •First •Prev •Next •Last •Go Back •Full Screen •Close •Quit Plan wykładu • Klasyfikacja oparta na podobieństwie.

•First •Prev •Next •Last •Go Back •Full Screen •Close •Quit

Page 10: k-NN i jego rozszerzeniaszczuka/mme/wyklad9.pdf · •First •Prev •Next •Last •Go Back •Full Screen •Close •Quit Plan wykładu • Klasyfikacja oparta na podobieństwie.

•First •Prev •Next •Last •Go Back •Full Screen •Close •Quit

Notacja

T zbiór etykietowanych przykładów treningowych.Delta Cronecker’a δ(a, b) = 1 iff a = b, 0 wpp.d(x, y) - odległość między obiektami.c(x) wartość decyzji dla x ze zbioru Vc.

Page 11: k-NN i jego rozszerzeniaszczuka/mme/wyklad9.pdf · •First •Prev •Next •Last •Go Back •Full Screen •Close •Quit Plan wykładu • Klasyfikacja oparta na podobieństwie.

•First •Prev •Next •Last •Go Back •Full Screen •Close •Quit

k− Nearest Neighbors

Odległość euklidesowa jest najczęściej, choć nie za-wsze słusznie, stosowana. Dla przykładów x, y

d(x, y) =√√√√√√ n∑i=1(ai(x)− ai(y))2

Zakładamy (na razie), że decyzja jest dyskretna.

Page 12: k-NN i jego rozszerzeniaszczuka/mme/wyklad9.pdf · •First •Prev •Next •Last •Go Back •Full Screen •Close •Quit Plan wykładu • Klasyfikacja oparta na podobieństwie.

•First •Prev •Next •Last •Go Back •Full Screen •Close •Quit

Algorytm k-NN

k-NN(T, k, x∗)NN := {x1, . . . , xk} = argminkx∈T d(x, x∗);c(x∗) := argmaxv∈Vc

∑ki=1 δ(v, c(xi));

return c(x∗);

Page 13: k-NN i jego rozszerzeniaszczuka/mme/wyklad9.pdf · •First •Prev •Next •Last •Go Back •Full Screen •Close •Quit Plan wykładu • Klasyfikacja oparta na podobieństwie.

•First •Prev •Next •Last •Go Back •Full Screen •Close •Quit

Dyskusja nad prostym k-NN

• Gdy ustalimy sąsiadów przestajemy dbać o od-ległość, co jest potencjalnie groźne.

•Wszystkie atrybuty traktujemy jednakowo.• Rozmiar k sąsiedztwa musi być znany.

Page 14: k-NN i jego rozszerzeniaszczuka/mme/wyklad9.pdf · •First •Prev •Next •Last •Go Back •Full Screen •Close •Quit Plan wykładu • Klasyfikacja oparta na podobieństwie.

•First •Prev •Next •Last •Go Back •Full Screen •Close •Quit

Rozszerzenia k-NN

• k-NN z wagami odległościowymi.• Odległość z wagami.• k-NN w predykcji numerycznej.

Page 15: k-NN i jego rozszerzeniaszczuka/mme/wyklad9.pdf · •First •Prev •Next •Last •Go Back •Full Screen •Close •Quit Plan wykładu • Klasyfikacja oparta na podobieństwie.

•First •Prev •Next •Last •Go Back •Full Screen •Close •Quit

k-NN z wagami odległościowymi

Przy poprzednich oznaczeniach:

c(x∗) := arg maxv∈Vc

k∑i=1wiδ(v, c(xi))

gdzie

wi =1

d(x∗, xi)2

Page 16: k-NN i jego rozszerzeniaszczuka/mme/wyklad9.pdf · •First •Prev •Next •Last •Go Back •Full Screen •Close •Quit Plan wykładu • Klasyfikacja oparta na podobieństwie.

•First •Prev •Next •Last •Go Back •Full Screen •Close •Quit

Odległość z wagami

d(x, y) =√√√√√√ n∑i=1ui(ai(x)− ai(y))2

Jeden ze sposobów ustalania wagi:

ui =1

(maxx∈T ai(x)−minx∈T ai(x))2

Page 17: k-NN i jego rozszerzeniaszczuka/mme/wyklad9.pdf · •First •Prev •Next •Last •Go Back •Full Screen •Close •Quit Plan wykładu • Klasyfikacja oparta na podobieństwie.

•First •Prev •Next •Last •Go Back •Full Screen •Close •Quit

k-NN w aproksymacji funkcji

Załóżmy, że mamy zbiór T etykietowanych przykła-dów postaci 〈x, f (x)〉 dla pewnej nieznanej funk-cji f (.). Chcemy wyznaczyć (przybliżyć) wartośćf̂ (x∗) dla poprzednio nie obserwowanego argu-mentu x∗. W najprostszym przypadku:

f̂ (x∗) =∑ki=1 f (xi)k

Page 18: k-NN i jego rozszerzeniaszczuka/mme/wyklad9.pdf · •First •Prev •Next •Last •Go Back •Full Screen •Close •Quit Plan wykładu • Klasyfikacja oparta na podobieństwie.

•First •Prev •Next •Last •Go Back •Full Screen •Close •Quit

Aproksymacja funkcji z wykorzystaniemodległości

Przy poprzednich oznaczeniach:

f̂ (x∗) =∑ki=1wif (xi)∑ki=1wi

Zauważmy, że ta metoda łatwo uogólnia się do me-tody globalnej, jeśli przyjmiemy k = |T |.

Page 19: k-NN i jego rozszerzeniaszczuka/mme/wyklad9.pdf · •First •Prev •Next •Last •Go Back •Full Screen •Close •Quit Plan wykładu • Klasyfikacja oparta na podobieństwie.

•First •Prev •Next •Last •Go Back •Full Screen •Close •Quit

Podsumowanie k-NN

• Prosty pomysł i implementacja.• Dwa biegunowo różne typy wyników.• Najprostsza z lokalnych metod aproksymacji.•Wiele ogólniejszych metod używa podobnychpodejść np. lokalna ważona regresja liniowa.

• Dla dużych i skomplikowanych danych koniecznesą usprawnienia w implementacji.