Top Banner
1 福水健次 統計数理研究所/総合研究大学院大学 大阪大学大阪大学大学院基礎工学研究科・集中講義 2014 September カーネル法入門 1.カーネル法へのイントロダクション
30

カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法:...

Aug 29, 2019

Download

Documents

doandat
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

1

福水健次

統計数理研究所/総合研究大学院大学

大阪大学大阪大学大学院基礎工学研究科・集中講義

2014 September

カーネル法入門1.カーネル法へのイントロダクション

Page 2: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

22

カーネル法:

近年 (1990年代半ばごろから) 発展したデータ解析の方法論.非線形な情報や高次モーメントの扱いが容易.

サポートベクターマシンの提案が発端となった.

Page 3: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

33

線形なデータ解析,非線形なデータ解析

Page 4: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

データ解析とは?Analysis of data is a process of inspecting, cleaning, transforming,

and modeling data with the goal of highlighting useful information, suggesting conclusions, and supporting decision making.

– Wikipedia

4

Page 5: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

線形なデータ解析– 数値の表 行列 表現

– 線形代数を使ってデータ解析を行う.

• 相関,• 主成分分析(Principal component analysis, PCA),• 正準相関分析(Canonical correlation analysis, CCA), etc.• 線形回帰,• 線形判別分析

• ロジスティック回帰 5

)()(1

)2()2(1

)1()1(1

Nm

N

m

m

XX

XX

XX

X m 次元N 個のデータ

Page 6: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

例1: 主成分分析(Principal component analysis, PCA)

PCA: 分散が最大となる低次元部分空間にデータを射影する..

1st direction =

6

][Varargmax 1|||| XaTa

N

i

N

jjiTT X

NXa

NXa

1

2

1)()( 11][Var

.aVa XXT

N

i

TN

jjiN

jji X

NXX

NX

N 11

)()(1

)()( 111XXV

--- X の分散共分散行列

Page 7: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

– 第p主成分方向

PCA 行列 の固有値問題

7

: VXX の第p最大固有値に対する単位固有ベクトル

Page 8: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

例2: 線形識別(判別)– 2値識別

識別器

を次にように構成する

– 例: Fisherの線形判別分析, 線形サポートベクターマシン, etc.

8

)()(1

)2()2(1

)1()1(1

Nm

N

m

m

XX

XX

XX

X

入力

N

NY

YY

Y }1{

)(

)2(

)1(

クラスラベル

)sgn()( bxaxh T

)()( )( ii YXh for all (or most) i.

Page 9: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

線形で十分か?

9

-6 -4 -2 0 2 4 6-6

-4

-2

0

2

4

6

x1

x2

線形識別不能

0

5

10

15

20 0

5

10

15

20

-15

-10

-5

0

5

10

15

z1

z3

z2

transform

)2,,(),,( 2122

21321 xxxxzzz

線形識別可能

Watch the movie! https://www.youtube.com/watch?v=3liCbRZPrZA

Page 10: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

Another example: correlation

10

][][],[YVarXVar

YXCovXY

22 ][][][][YEYEXEXE

YEYXEXE

-3 -2 -1 0 1 2 3-3

-2

-1

0

1

2

3

X

Y

= 0.94

Page 11: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

11

0 0.5 1 1.5 2 2.5-0.5

0

0.5

1

1.5

2

2.5

-1.5 -1 -0.5 0 0.5 1 1.5-0.5

0

0.5

1

1.5

2

2.5

X

Y ( X, Y ) = 0.17

( X2,Y )= 0.96

transform(X, Y) (X2, Y)

Page 12: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

12

がん研 多目的コホート研究(JPHC Study)肥満度(BMI)のがん全体の罹患に与える影響

Page 13: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

非線形変換は有望

Analysis of data is a process of inspecting, cleaning, transforming,and modeling data with the goal of highlighting useful information, suggesting conclusions, and supporting decision making.

Wikipedia.

カーネル法 = データの非線形情報,高次モーメントを抽出するために,データを高次元の特徴空間に写像する方法論.

13

Page 14: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

カーネル法の要点

14

Page 15: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

カーネル法の概略– カーネル法の概念図

– 特徴空間として望まれる性質:

• データのさまざまな非線形特徴を有していること

• 内積計算が容易にできること. 多くの線形データ解析の計算は内積に依拠している.

15

特徴空間

xi Hk

xj

,ix

jx

元のデータの空間

特徴写像

特徴空間で線形データ解析を施す!e.g. SVM

Page 16: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

計算の問題– 高次情報の抽出

(X, Y, Z) (X, Y, Z, X2, Y2, Z2, XY, YZ, ZX, …)

– 元の空間の次元が高いと 計算は実現できない!

e.g. 10000 次元のデータ, 2次までの特徴

10000C1 + 10000C2 = 50,005,000

– 計算量爆発.より効率的な方法が必要 カーネル法

16

Page 17: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

特徴空間と正定値カーネル

– 特徴写像: 元の空間から特徴空間への写像

– 特別な特徴空間(再生核ヒルベルト空間)を用いると,特徴ベクトルの内積計算が関数値 (正定値カーネル) , の評価に置き換えられる

– 内積計算さえできれば,特徴ベクトル (X).の陽な形は知らなくてもよい.

17

),()(),( jiji XXkXX kernel trick

Φ: Ω → , ↦ Φ

Page 18: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

正定値カーネル定義.

: 集合

カーネル : Ω Ω → が正定値であるとは

1) (対称性)

2) (正値性) 任意の点 , … , ∈ Ω ∀ に対し,

18

0),(1,

n

ji jiji xxkcc

),(),(

),(),(

1

111

nnn

n

xxkxxk

xxkxxk

),(),( xykyxk

が半正定値

i.e., for any Ric

(Gram行列)

Page 19: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

– 例: Rm上

• Euclid内積

• Gaussian RBF カーネル

• Laplace カーネル

• 多項式カーネル

19

22exp),( yxyxkG

dTP yxcyxk )(),( ),0( N dc

)0(

m

i iiL yxyxk1

||exp),(

)0(

yxyxk T),(

Gaussian

Laplacian

Page 20: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

命題1.1を内積 ⋅,⋅ を持つベクトル空間とし, Φ: Ω → を写像(特徴写像)

とする. : Ω Ω → を

, Φ ,Φ ,

により定義すると, , は正定値である.

– カーネルトリックを成り立たせる関数は,正定値カーネルである.

20

(kernel trick)

0)()(),(2

111

n

i iin

j jjn

i ii XcXcXc

n

i

n

j jijin

ji jiji XXccXXkcc1 11,

)(),(),(*Proof)

Page 21: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

– 正定値性は十分でもある.

定理1.2 (Moore-Aronszajn)Ω上の正定値カーネル に対し,Ω上の関数からなるHilbert空間*

(再生核ヒルベルト空間, RKHS) が存在して,次が成り立つ.

1) ⋅, ∈ ∀ ∈ Ω .2) span ⋅, ∈ Ω は で稠密

3) (再生性), ⋅, for any ∈ , ∈ Ω.

*Hilbert空間: 内積を持つベクトル空間で,内積により決まるノルムが完備であるもの.

21

Page 22: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

正定値カーネルによる特徴写像– 正定値カーネル を用意

– 特徴空間 = RKHS– 特徴写像:

Φ: Ω → , ↦ ⋅,

, … , ↦ ⋅, , … , ⋅,

– カーネルトリック(再生性):

– 正定値カーネルを与えれば十分.• 特徴写像,特徴ベクトルを陽に知る必要はない.

• カーネル法の計算は,グラム行列 , による計算となる.

22

),,()(),( jiji XXkXX

Feature space

xi Hk

xj

,ix

jx

Space of original data

feature map

Page 23: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

カーネル法の例:カーネルPCA

23

Page 24: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

PCAからカーネルPCAへ– PCA: 線形な次元削減.– カーネルPCA: 非線形な次元削減 (Schölkopf et al. 1998).

– 特徴空間でPCAを行う

24

:max 1|||| f

:max 1|||| a

N

i

N

jjiTT X

NXa

NXa

1

2

1)()( 11][Var

N

i

N

jji X

NXf

NXf

1

2

1)()( )(1)(,1])(,[Var

Page 25: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

次の形の を考えれば十分

(直交する方向は分散に効いてこない!) [Representer定理]

25

N

i

N

jj

Ni

i XXcf1

1)(1)( )()(

max

subject to 1~1|||| cKcf XT

(カーネルトリックを使うと)

N

bbiji

ijX XXkN

XXkK1

)()()()( ),(1),(~

N

babaN

aja XXk

NXXk

N 1,)()(

21)()( ),(1),(1

(中心化Gram行列)

f

Var ,Φ1

Page 26: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

– 証明

• ∑ Φ とすると, [ Φ ≡ Φ ∑ Φ ]

Var , Φ ∑ ,Φ

∑ ∑ Φ ,Φ

∑ ∑ Φ ,Φ

∑ ∑ .

• ∑ Φ ,∑ Φ∑ .

• Φ ∑ Φ ,Φ ∑ Φ

, ∑ , ∑ , ∑ ,,

26

Page 27: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

カーネルPCAのアルゴリズム:• 中心化Gram行列 の計算

• の固有分解

• 第p主成分方向 ∑ Φ ,

• X(i)の第p主成分 , Φ

27

N

iTiiiX uuK

1

~

021 N eigenvalues

unit eigenvectorsNuuu ,,, 21

Φ Φ ∑ Φ : 中心化特徴ベクトル

Page 28: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

カーネルPCAの例

Wine データ (UCI repository)

3種類のイタリアワインに関する,13 次元の化学測定値

178 データ.クラスの情報はカーネルPCAには用いていない

28-5 0 5-4

-3

-2

-1

0

1

2

3

4

-0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6Linear PCA Kernel PCA (Gaussian kernel)

( = 3)

28

Page 29: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

カーネル法の構成要素

– 特徴空間上で線形データ解析を適用する. (Kernelization)

– 多くの場合,目的関数をカーネルによって書き直すことができる

– 解は以下の形で考えれば十分である(有限パラメータの問題に還元)

(Representer定理), すべての量がGram行列によって表現される(サイズ = データ数).

– 元の空間が高次元でも計算量の問題が生じない.Gram行列を計算した後は,データ数のみに依存した計算量.

以上はカーネル法一般に共通の要素である.29

),()(),( jiji XXkXX )(, iXf

,)(1

)(

N

i

ii Xcf

Page 30: カーネル法入門 - ism.ac.jpfukumizu/OsakaU2014/OsakaU_1intro.pdf · カーネル法入門 1.カーネル法へのイントロダクション . 2 カーネル法: 近年(1990年代半ばごろから)

参考文献 福水 「カーネル法入門」 1章 朝倉書店 2010.

B. Schölkopf and A. Smola. Learning with kernels. MIT Press, 2002.

赤穂 「カーネル多変量解析 ―非線形データ解析の新しい展開」 岩波書店(2008)

30