Top Banner
ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN ------------------------------- TRỊNH ĐÌNH DUY RÚT TRÍCH THÔNG TIN TỪ KHUÔN MẶT VÀ TÁI HIỆN LẠI TRÊN MÔ HÌNH 3D Chuyên ngành : KHOA HỌC MÁY TÍNH Mã số : CH0601013 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS. LÊ HOÀI BẮC
62

110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

Nov 09, 2014

Download

Documents

quangyen
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN

-------------------------------

TRỊNH ĐÌNH DUY

RÚT TRÍCH THÔNG TIN TỪ KHUÔN MẶT

VÀ TÁI HIỆN LẠI TRÊN MÔ HÌNH 3D

Chuyên ngành : KHOA HỌC MÁY TÍNH

Mã số : CH0601013

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC:

PGS.TS. LÊ HOÀI BẮC

Thành phố Hồ Chí Minh – Năm 2009

Page 2: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

Lời Cám Ơn

(VIẾT SAU)

1

Page 3: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

Lời Cam Đoan

`

(VIẾT SAU)

2

Page 4: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

Mục Lục

Trang

Trang Phụ Bìa

Lời Cám Ơn................................................................................................................1

Lời Cam Đoan.............................................................................................................2

Mục Lục......................................................................................................................3

Danh Mục Các Ký Hiệu, Các Chữ Viết Tắt...............................................................5

Danh Mục Các Từ Nguyên Gốc Tiếng Anh...............................................................5

Danh Mục Các Bảng...................................................................................................7

Danh Mục Các Hình...................................................................................................8

MƠ ĐÂU....................................................................................................................9

Chương 1 - TÔNG QUAN........................................................................................12

1.1. Giới Thiệu......................................................................................................12

1.1.1. Do tìm khuôn măt...................................................................................13

1.1.2. Rut trích những điêm trên khuôn măt.....................................................13

1.2. Những Thách Thức........................................................................................16

1.3. Phát Biêu Bài Toán........................................................................................18

1.4. Pham Vi Đê Tài.............................................................................................18

1.5. Những Đóng Góp...........................................................................................19

1.6. Câu Truc Luân Văn........................................................................................19

Chương 2 - RUT TRÍCH THÔNG TIN KHUÔN MĂT..........................................20

2.1. Giới thiệu.......................................................................................................20

2.2. Do Tìm Khuôn Măt........................................................................................20

2.2.1. Giới thiệu................................................................................................20

2.2.2. Những Đăc Trưng dựa trên Gợn Sóng (Wavelet-based Features)..........21

2.2.2.1. Haar wavelet....................................................................................22

2.2.2.2. Haar cascades file............................................................................24

2.2.3. Thảo luân................................................................................................27

3

Page 5: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

2.3. Rut Trích Thông Tin Từ Khuôn Măt.............................................................28

2.3.1. Xác đinh vung cân quan tâm...................................................................28

2.3.2. Những điêm đăc trưng cân rut trích........................................................29

2.3.3. ASM........................................................................................................32

2.3.3.3. Hình dáng.........................................................................................32

2.3.3.4. Biến đôi hình dáng...........................................................................33

2.3.3.5. Mô hình hình dáng...........................................................................33

2.4. Cơ sơ dữ liệu ảnh...........................................................................................33

Chương 3 - XÂY DƯNG CHƯƠNG TRINH..........................................................34

Chương 4 - THƯ NGHIỆM......................................................................................36

4.1. Bô Dữ Liệu Thư Nghiệm...............................................................................36

Chương 5 - KẾT LUẬN...........................................................................................37

5.1. Kết Quả..........................................................................................................37

5.2. Khuyến Nghi..................................................................................................37

TÀI LIỆU THAM KHAO........................................................................................38

4

Page 6: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

Danh Mục Các Ký Hiệu, Các Chữ Viết Tắt

- CV : Computer Vision (Thi giác máy tính)

- ASM : Active Shape Model

- Nnk : Những Người Khác

- SVM : Support Vector Machine

Danh Mục Các Từ Nguyên Gốc Tiếng Anh

- Coarse-to-fine : từ thô xơ đến tinh vi

- A multi-stage approach : môt phương pháp gồm nhiêu giai đoan

- Frontal view : phía trước

- Multi view : nhiêu góc nhìn như những hướng xoay khác

nhau

- State-of-the-art : tinh xảo

- Scale : đô co giãn

- Recall paper :

- A low false positive rate : ty lệ xác thực sai số thâp

- A weak classifier : pha

- Robust : nhanh

- Integral image filter : bô lọc ảnh tích phân

- Alignment : phân đoan - segmentation (như phân đoan

khuôn măt)

- Classifier : bô phân lớp

- Shape : hình dáng

- Shape model : mô hình hình dáng

- Profile model : mô hình

- Landmark : mốc ranh giới

5

Page 7: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

- Statistical shape model : mô hình thống kê

- Facial feature : đăc trưng khuôn măt

- Eigenvalues : giá tri riêng

- Eigenvectors : vector riêng

6

Page 8: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

Danh Mục Các Bảng

Bảng 1-1: Những điêm đăc trưng cân rut trích........................................................14

Bảng 2-1: Đoan mã cách tao ra ảnh tích phân.........................................................24

7

Page 9: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

Danh Mục Các Hình

Hình 1-1: Câu truc hệ thống theo doi khuôn măt từ webcam...................................14

Hình 1-2: Kết quả tìm kiếm cua hệ thống nhân diện khuôn với đô phân giải thâp. .14

Hình 1-3: Hình minh hoa tính năng nhân diện khuôn măt cua iPhone.....................15

Hình 1-4: Môt cảnh trong tro chơi ZingDance.........................................................16

Hình 1-5: Mô hình các bước đê xây dựng................................................................18

Hình 2-1: Những đăc tính cua gợn sóng Haar..........................................................22

Hình 2-2: Cách tao ra ảnh tích phân.........................................................................23

Hình 2-3: Chia vung khuôn măt thành những vung nho hơn đê thao tác. (a) Xác

đinh vung mắt (b) Xác đinh vung miệng dựa trên khoảng cách mắt (Eye Distance –

ED)............................................................................................................................28

Hình 2-4: 20 điêm đăc trưng trên khuôn măt – hình từ BioID.................................29

Hình 2-5: Mô hình 20 điêm đăc trưng trên khuôn măt............................................30

Hình 2-6: Bên trái là môt hình dáng đơn giản với 3 điêm........................................33

Hình 3-1: Lược đồ lớp cua chương trình..................................................................34

8

Page 10: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

MƠ ĐÂU

Với những nghiên cứu liên quan đến sự tương tác giữa khuôn măt và máy tính

se giup ích rât nhiêu cho những người khuyết tât, những ứng dụng an ninh, truy tìm

tôi pham, cung như ngày nay càng nhiêu hình ảnh, đoan phim dài được chia se và

có nhu câu truy tìm thông tin trơ nên cân thiết, môt trong những hướng có thê tiếp

cân là dựa vào những đăc trưng khuôn măt, và bài toán rut trích đăc trưng là những

bước cơ bản cho hướng nghiên cứu này. Cung như từ những bước cơ bản này,

chung ta phát triên những nghiên cứu vê nhân dang biêu cảm, nen ảnh, hiêu cách ra

hiệu cua môi (lip-reading) [68].

Ngày nay, với sự phát triên cua webcam thì nhu câu cua việc ứng dụng thông

minh vào hệ thống an ninh càng trơ nên câp thiết. Điêu này giup cho hệ thống tự

đông nhân dang các đối tượng ơ môt vi trí nhât đinh môt cách dê dàng. [40]

[61] Trong môt thâp ky qua, vân đê sinh trắc học như mống mắt, vân tay,

khuôn măt trong lĩnh vực an ninh đã trơ thành môt trong những chu đê quan trọng

cua các chính phu và những nhà nghiên cứu trên thế giới. Tuy nhiên, đê có được kết

quả phân tích chính xác cao trong sinh trắc học như mống mắt hay vân tay, đoi hoi

phải có sự hợp tác chăt che từ phía đối tượng được phân tích. Chăng han đối với

vân tay, người cân phân tích phải tuân thu các điêu kiện là tay không được ướt,

cung như cách quet lên hệ thống đó phải đu manh và đêu thì hệ thống mới nhân

dang được. Bên canh đó, việc phân tích mống mắt đoi hoi đối tượng cân phân tích

phải đưa mắt cua mình vào đung vi trí mà hệ thống yêu câu, măt khác đê có được

hình ảnh mống mắt chât lượng tốt thì cân phải có môt công nghệ tiên tiến với chi

phí cao thì hệ thống mới có đung dữ liệu đâu vào đê phân tích. Điêu này gây khó

khăn cho việc ứng dụng công nghệ phân tích vân tay và mống mắt trong thực tế. Do

đó, người ta đã chu ý đến những yếu tố khác cua sinh trắc học và khuôn măt là đối

tượng thu hut được sự quan tâm cua nhiêu người, vì công nghệ phân tích khuôn măt

9

Page 11: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

không đoi hoi các điêu kiện khắc khe nhưng vân cho ta kết quả phân tích ơ mức

châp nhân được.

Măc khác, đê việc xây dựng những công cụ tìm kiếm hình ảnh hay đoan phim

đáp ứng được nhu câu thực tế thì đó không phải là môt công việc dê dàng mà là môt

thách thức lớn trong lĩnh vực thi giác máy tính. Nếu như các công cụ tìm kiếm hiện

nay cân dữ liệu đâu vào là chuôi các từ khoá, thì công cụ tìm kiếm đa phương tiện

cân dữ liệu đâu vào là hình ảnh (con gọi là visual words). Tuy nhiên, đê hiêu được

nôi dụng hình ảnh thì chung ta cân rut trích đăc tính cua đối tượng tinh vi hơn. Đây

cung là môt thách thức lớn đối với các nhà nghiên cứu. Vì vây, đê làm cho bài toán

đơn giản nhưng khả thi hơn, chung ta cân thực hiện rut trích thông tin từ khuôn măt

cua con người. [46]

[48] Việc rut trích thông tin từ khuôn măt là môt trong những vân đê cơ bản có

thê cho chung ta ứng dụng vào trong thực tế như: nhân dang khuôn măt (face

recognition), theo doi khuôn măt (face tracking), phân tích biêu lô khuôn măt, theo

doi cái nhìn chăm chăm (gaze tracking), hiêu cách ra hiệu cua môi (lip-reading).

[70] Do đó, đê xư lý được thông tin từ khuôn măt thì trước tiên chung ta cân đinh vi

mắt. Đây là môt trong những bước cơ bản nhât cua tiến trình phân tích [29]. Như

chung ta biết, đô sai số trong giai đoan đinh vi những đăc tính ảnh hương rât lớn

đến ty lệ nhân dang mà chung ta không thê biết trước được.

Đây là cơ hôi đê tiếp tục nghiên cứu trong lĩnh vực xư lý hình ảnh này. Từ

những thông tin rut trích được, có thê ứng dụng trong lĩnh vực an ninh (chăng han

tìm ra những tên trôm trong hồ sơ lưu trữ thông tin con người), nen ảnh, và những

tương tác giữa con người và máy tính. Nhiêu công ty xe, có thê ứng dụng công nghệ

nhân dang đê do tìm những biêu cảm cua tài xế đê đưa ra những cảnh báo hợp lý.

Hay những nhà quảng cáo trên web cân biết những thông tin vê khuôn măt xem xet

sự hiệu quả cua những logo có thê đăt ơ nơi nào trên công thông tin web đó. Thêm

nữa, những công ty làm phim 3D cung quan tâm đến những thông tin biêu cảm cua

khuôn măt cho những sản phâm cua họ.

10

Page 12: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

Trong luân văn này, tôi tâp trung vào vân đê rut trích được những thông tin

trên khuôn măt (những điêm trên khuôn măt) cung như những thông tin 3D cua nó,

chung tôi đưa ra môt phương pháp gồm nhiêu giai đoan đê giảm thời gian do tìm

trong khi vân đảm bảo ty lệ do tìm cao. Đâu tiên chung ta cân phải xem xet phương

pháp do tìm khuôn măt nhanh, đê giới han lai vung cân rut trích. Tiếp đến, chung ta

áp dụng môt phương pháp rut trích trên vung vừa do tìm đê xác đinh được những

điêm cân quan tâm trên khuôn măt như mắt, mui, miệng.

Trong giai đoan do tìm khuôn măt, tôi chỉ xem xet những khuôn măt ơ phía

trước (frontal view) và tôi đê xuât phương pháp Adaboost [27], bơi phương pháp

này cho kết quả nhanh. Và giai đoan sau, tôi se tâp trung vào xem xet môt trong hai

phương pháp ASM, SVM, Gabor, cho quá trình rut trích những thông tin trên khuôn

măt và xem xet phương pháp Kalman đê giải quyết bài toán theo thời gian thực.

11

Page 13: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

Chương 1 - TÔNG QUAN

1.1. Giới Thiệu

Những thách thức trong những năm qua đó là xây dựng những ứng dụng tìm

kiếm những dữ liệu đa phương tiện sẵn sàng cho người dung. Việc xư lý khuôn măt,

cung như rut trích thông tin từ khuôn măt đóng vai tro quan trọng. Bơi le, hiện nay

vân đê tìm kiếm thông tin từ dữ liệu video vân con bo ngo, và môt trong những

hướng tiếp cân đó là tìm kiếm dựa trên khuôn măt. [46] Trong công trình này, tác

giả đã đưa ra những phương pháp đê rut trích tự đông và tô chức số lượng lớn

những khuôn măt cho quá trình lâp chỉ mục, đat lây dữ liệu video.

Nguyên Thành Thái (2006), Nhân Dang Măt Người Dung SVM và Mang

Nơron, Luân Văn Thac Sĩ, DHCNTT TpHCM, TpHCM. [tóm tắt] [2] đã kết hợp

giữa SVM và mang nơron đê nhân dang khuôn măt.

[4] đã phát triên môt hệ thống cho phep tự đông xác đinh được nhiêu khuôn măt

cung luc với các thành phân mắt mui miệng và đã đat được đô chính xác khá cao

bơi việc loai các thành phân gây nhiêu.

[8]

[66] đã có những khảo sát trong lĩnh vực nhân dang, ông và các đồng nghiệp đã

chỉ ra răng những phương pháp xác thực dựa trên mât khâu hay ký hiệu thì quá dê

đê phá vơ. Những phương pháp sinh trắc học là môt lựa chọn hợp lý nhưng cung có

những măt han chế.

- Phương pháp quet mống mắt rât tin cây nhưng áp đăt người sư dụng quá

nhiêu, chi phí mắc đê thực hiện và không được châp nhân bơi nhiêu người.

- Nhân dang vân tay được châp nhân mang tính chât xã hôi, nhưng không thê

ứng dụng đối với những người không tán thành.

- Ngược lai, nhân dang khuôn măt tương ứng với môt sự thoả hiệp giữa sự

châp nhân có tính chât xã hôi và tinh cây.

Trong nhiêu thâp ky qua, những tiến bô chính đã xuât hiện trong nhân dang với

nhiêu hệ thống có khả năng đat được ty lệ nhân dang hơn 90%. Tuy nhiên, trong

12

Page 14: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

ngữ cảnh cua thế giới thực vân tồn tai thách thức, bơi những xư lý khuôn măt có thê

chiu đựng những thách thức lớn sự biến đôi lớn.

Trong quá trình rut trích thông tin khuôn măt, bước đâu tiên cân phải xác đinh

khuôn măt. Trong nghiên cứu này, chung ta xem xet phương pháp

1.1.1. Do tìm khuôn măt

Pham Thế Bảo & nnk, 2006 đã có khảo sát tông quan vê những phương pháp

xác đinh khuôn măt.

Hiện nay, Adaboost là môt phương pháp phô biến cho việc do tìm khuôn măt.

Nó cung đã được công đồng các nhà phát triên cung nhau xây dựng, đó là hệ thống

mã nguồn mơ OpenCV. Phương pháp này được sư dụng đê do tìm khuôn măt, cung

như các thành phân trên khuôn măt nhờ vào những bô thư viện huân luyện. Môt số

tác giả cung đã sư dụng bô thư viện OpenCV và bô huân luyện khuôn măt và mắt

cho việc do tìm khuôn măt và mắt [8].

1.1.2. Rut trich những điêm trên khuôn măt

[Tony Kamenick & nnk, web] đã xây dựng ứng dụng lây những hình ảnh từ

webcam theo thời gian thực, sau đó rut trích những vectơ đăc trưng đã được đinh

nghĩa trước và gơi đến SVM đê phân lớp đê phân loai những hành đông cua khuôn

măt tương ứng với những hành đông cua con chuôt máy tính. Đây là môt giải pháp

thay thế việc sư dụng chuôt.

13

Page 15: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

Hinh 1-1: Câu truc hê thông theo doi khuôn măt tư webcam

IBM cung có môt dự án tương tự với tên gọi Head-tracking pointer.

Nhà nghiên cứu Pablo Hennings-Yeomans tai Đai học Carnegie Mellon đã phát

triên môt hệ thống nhân diện khuôn măt có thê hoat đông với những hình ảnh có đô

phân giải thâp. Thuât toán siêu phân giải này se được cải thiện thêm và tích hợp vào

công cụ web đê tìm kiếm video trên YouTube. [74]

Hinh 1-2: Kêt qua tim kiêm cua hê thông nhân diên khuôn vơi đô phân giai thâp

Như chung ta đã biết, iPhone là môt trong số những di đông bán chay nhât hiện

nay. Họ đã nôp đơn xin đăng ký băng sáng chế cho môt số tính năng mới, trong đó

có tính năng nhân diện khuôn (theo Register, TGDaily).

14

Page 16: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

Hinh 1-3: Hinh minh hoa tinh năng nhân diên khuôn măt cua iPhone

Và trong tương lai, những chiếc điện thoai thế hệ 3G phát triên manh, việc sư

dụng Avatar đông là những đối tượng 3D trong quá trình gọi điện thoai có video se

được ứng dụng. Những ứng dụng dang này se sư dụng những ky thuât rut trích

thông tin từ khuôn măt đê tái hiện những hình ảnh 3D cư đông như khuôn măt con

người.

15

Page 17: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

Hinh 1-4: Môt canh trong tro chơi ZingDance

Với những tro chơi 3D, việc cho phep chọn những đồ đac măc trên người đê

tăng thêm ve đep cua nhân vât. Ngoài ra, nếu khuôn măt và những hành đông cư chỉ

gân giống với người thât se giup cho người chơi hoà nhâp tốt hơn với tro chơi đó.

Và những ứng dụng trong việc làm phim 3D tiện lợi hơn rât nhiêu. Điêu này se dê

dàng làm được nếu chung ta có được những công nghệ rut trích khuôn măt.

1.2. Những Thách Thức

[57] Đinh vi đăc tính trên khuôn măt tự đông đã được thư thách lâu dài trong

lĩnh vực thi giác máy tính trong nhiêu thâp ky qua. Điêu này có thê được giải thích

bơi khả năng rông lớn, môt khuôn măt trong môt bức hình có thê có được là nhờ

những yếu tố như vi trí, biêu cảm, tư thế, đô chiếu sáng và nên lôn xôn.

Sự xuât hiện cua khuôn măt thay đôi quyết liệt do biêu cảm, tư thế, đô chiếu

sáng, (expression [Peter & nnk, 1997], pose [Georghiades & nnk, 2001] and

illumination [Adini & nnk, 1997]) tuôi tác, và những thay đôi hình tượng (chăng

16

Page 18: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

han râu, kính). Sự biến đôi lớn trong sự xuât hiện cua khuôn măt làm những thuât

toán nhân dang trên những bức hình và video trơ thành môt thách thức. Cân xây

dựng môt phương pháp nhanh đê giải quyết những vân đê khó khăn này.

Bài toán rut trích thông tin từ khuôn măt là môt vân đê khó trong lĩnh vực thi

giác máy tính (computer vision) trong nhiêu năm qua. Điêu này có thê giải thích bơi

những thay đôi lớn cua khuôn măt trong môt khung cảnh qua những yếu tố như:

- Sự biêu cảm cua khuôn măt (expression [Peter & nnk, 1997]): có ảnh hương

đáng kê lên các thông số cua khuôn măt. Chăng han, cung môt khuôn măt

môt người, nhưng se rât khác khi họ cười hay buồn, …

- Tư thế, góc nhìn (pose [Georghiades & nnk, 2001]: ơ những tư thế khác nhau

có thê se làm khuât môt phân mắt, mui, miệng hoăc thâm chí khuât hết. Gây

khó khăn cho việc rut trích những điêm đăc trưng.

- Những thay đôi đô chiếu sáng illumination [Adini & nnk, 1997]): những biến

đôi đô chiếu sáng do những thuôc tính phản xa với da, và do tính chât

camera se ảnh hương đến chât lượng ảnh.

- Tuôi tác, những thay đôi hình dáng (chăng han sự che khuât cua râu, kính):

làm bài toán trơ nên phức tap hơn, phải xem xet nhiêu trường hợp hơn.

- Đô phân giải khác nhau (resolution):

- Sự đa dang hoá cua màu da

- Các khuôn măt dính vào nhau trong cung 1 bức ảnh

- Bên canh đó, việc rut trích đăc tính mắt, miệng với đô chính xác cao, theo

thời gian thực, đồng thời cho những kết quả vê biêu hiện khác nhau cua

khuôn măt vân con găp nhiêu khó khăn. Bơi môt trong những ứng dụng cua

nó là đọc môi (lip reading), chăng han như trong

1.3. Phát Biêu Bai Toán

Từ môt ảnh với kích thước nào đó, chung ta tìm môt phương pháp đê xác đinh

nhanh trong ảnh đó có khuôn măt hay không. Sau đó tìm phương pháp rut trích đăc

17

Page 19: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

trưng cua khuôn măt đó và kết hợp ky thuât 3D đê tái hiện những cư đông trên mô

hình 3D đó.

Hinh 1-5: Mô hinh cac bươc đê xây dưng

- Việc đinh vi mắt cung găp khó khăn như sự có măt cua kính cung là môt

thách thức lớn cho việc nghiên cứu.

- Chung ta cân xem xet xác đinh mui trước không?

- ASM có thê do tìm những điêm rut trích nhanh, nhưng AAM thì sao?

- Môt điêu nữa là xem xet bài toán ơ mức đô chính xác cao, đăc biệt là với

thông tin miệng, đây có thê ứng dụng nhiêu vào ngành giải trí 3D.

1.4. Pham Vi Đê Tai

Trong đê tài này, chung tôi tâp trung tìm kiếm và đê xuât môt thuât toán hiệu

quả cho việc rut trích đăc trưng ảnh như mắt, mui, miệng. Do sự phức tap cua bài

toán đã nói trong mục 1.2, chung tôi đưa ra những giả đinh và ràng buôc sau nhăm

giảm đô phức tap cua bài toán:

- Anh khuôn măt ơ phía trước (frontal view)

- Điêu kiện ánh sáng bình thường

Tái hiện trên mô

hình 3D

Rut trích những đăc

tính

(Feature extraction

- FE)

Nhân dang khuôn

măt

(Face detection -

FD)

18

Page 20: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

1.5. Những Đóng Góp

Tìm hiêu môt phương pháp manh yếu khác nhau cho quá trình đinh vi, rut

trích thông tin khuôn măt với mức đô chính xác cao, đồng thời cung đáp ứng xư lý

nhanh theo thời gian thực (realtime).

Xây dựng ứng dụng minh hoa đê thây được khả năng ứng dụng cua ky thuât

mà tôi tìm hiêu, nghiên cứu.

1.6. Câu Truc Luân Văn

Luân văn này được tô chức như sau:

19

Page 21: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

Chương 2 - RÚT TRÍCH THÔNG TIN KHUÔN MẶT

2.1. Giới thiệu

Những thông tin khuôn măt được hiêu như những điêm đăc trưng, những

điêm nôi bât cua khuôn măt như những góc cua mắt, những góc cua lông mày,

những góc và những điêm giữa ngoài cua môi, những góc cua lô mui, đỉnh cua mui

(tip of the nose), đỉnh cua căm (tip of the chin) (xem ).

Đinh vi những điêm đăc trưng trên khuôn măt là giai đoan quan trọng cho

nhiêu công trình liên quan đến xư lý ảnh khuôn măt. Ơ đây, trong nhiêu công trình

đê xuât chọn môt thuât toán do tìm khuôn măt nhanh và manh, đó là môt phiên bản

cua do tìm khuôn măt Viola-Jones [67]. Sau đó, [33] đê nghi chia vung khuôn măt

đã do tìm ra thành 20 vung cân quan tâm (regions of interest) đê đinh vi những điêm

đăc trưng này.

Chung ta xem xet từng giai đoan cho quá trình rut trích thông tin như sau:

2.2. Do Tìm Khuôn Măt

2.2.1. Giới thiệu

- Trong giai đoan này, chung ta cân xem xet hướng, ty lệ khác nhau cua khuôn

măt.

- Tìm phương pháp do tìm nhanh, manh khuôn măt phía trước (front face), nếu

tìm khuôn măt ơ nhiêu góc nhìn khác nhau (multi-view face) càng tốt.

Nhưng phải trên tiêu chí nhanh, làm tiên đê tốt cho giai đoan rut trích.

Phương pháp đê xuât là sư dụng Adaboost đê do tìm khuôn măt hướng phía trước

(frontal) [27]. Đây là phương pháp xác đinh khuôn măt nhanh và manh, đã được

Viola-Jones đưa ra. Việc do tìm se thực hiện trên môi khung hình theo thời gian

thực, có đô chính xác cao và hiệu suât thực hiện nhanh. Cung có phương pháp khác

với đô tin cây cao hơn bơi việc do tìm khuôn măt ơ nhiêu góc nhìn [63], nhưng kết

quả cua nó se không đu thông tin như mắt, mui, miệng, đáp ứng cho giai đoan rut

trích.

20

Page 22: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

2.2.2. Những Đăc Trưng dựa trên Gợn Sóng (Wavelet-based Features)

According to the study of C. Papageorgiou [70], the wavelet coefficients preserve

all the information in the original image,

but the coding of the visual information differs from the pixel-based representation

[46] Theo nghiên cứu cua C. Papageorgiou, những hệ số gợn sóng (wavelet) bảo tồn

được tât cả thông tin cua hình ảnh nguồn, nhưng việc mã hoá cua những thông tin

nhìn thây được khác với việc biêu diên dựa vào điêm ảnh (pixel) trong 2 cách: làm

những biến cua lớp bên trong tối thiêu, và cua lớp bên ngoài tối đa môt cách đồng

bô.

Đâu tiên, sự khác nhau cường đô trung bình giữa những vung cục bô theo những

hướng khác nhau được mã hoá trong môt khung đa ty lệ. Những ràng buôc trên

những giá tri cua gợn sóng có thê biêu diên những đăc tính nhìn thây được cua lớp

đối tượng: phản ứng manh từ gợn sóng chỉ ra sự hiện diện cua sự khác nhau manh

me, hoăc biên giới từ gợi sóng trong bức ảnh, trong khi phản ứng yếu từ gợn sóng

chỉ ra khu vực tương đồng.

Thứ hai, việc sư dụng những nên tảng hoàn thiện, ví dụ, nên tảng Haar, cho phep

chung ta lan truyên những ràng buôc giữa những vung lân cân và mô tả những mâu

phức tap. Biến đôi gợn sóng mât đô gân bốn lân cung câp đô phân giải cao và dân

đến môt bô tự điên phong phu, hoàn thiện cua những đăc tính.

21

Page 23: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

2.2.2.1. Haar wavelet

Hinh 2-6: Những đăc tinh cua gợn sóng Haar

Những đăc trưng Haar (Haar like features) la gì?

[OpenCVWiki] Những đăc trưng Haar mã hoá sự tồn tai cua những tương phản

được đinh hướng giữa những vung trong ảnh. Môt bô cua những đăc trưng này có

thê được sư dụng đê mã hoá những tương phản cua môt khuôn măt và những liên hệ

không gian giữa chung.

Đâu tiên, môt bô phân lớp (classifier) là môt cái thác (cascade) cua những bô phân

lớp nâng cao dân, được huân luyện với vài trăm những mâu cua đối tượng cân quan

tâm (chăng han khuôn măt, xe …), được gọi là những mâu khăng đinh (positive),

những mâu này được co giãn vê cung môt kích thước (20x20) và những mâu phu

đinh (nagetive), là những mâu gân giống với đối tượng quan tâm nhưng không phải

đối tượng đó, cung có cung kích thước.

Sau khi bô phân lớp được huân luyện, nó có thê thực hiện trên những vung quan

tâm trong môt ảnh đâu vào. Bô phân lớp se xuât ra “1” nếu vung đó giống đối tượng

quan tâm và ngược lai là “0”. Đê tìm kiếm đối tượng trong toàn bô ảnh, chung ta

phải di chuyên môt cưa sô tìm kiếm dọc theo ảnh đê kiêm tra môi vi trí bơi việc sư

dụng bô phân lớp đó. Bô phân lớp phải được thiết kế đê có thê dê dàng thay đôi

kích thước cho việc tìm kiếm những đối tượng quan tâm với những kích thước khác

nhau, điêu này hiệu quả hơn việc thay đôi chính kích thước cua ảnh. Và môt điêu

nữa là việc tìm kiếm những đối tượng với kích thước chưa biết, chung ta cân có môt

thuât toán quet qua vài lân trên ảnh với những ty lệ co giãn khác nhau.

22

Page 24: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

Môt cái thác cua những bô phân lớp nghĩa là bô phân lớp kết quả gồm vài bô phân

lớp đơn giản hơn đê thực hiện trên vung quan tâm cho đến khi tai môt giai đoan nào

đó, đối tượng bi từ chối bơi bô phân lớp cua giai đoan tương ứng, thì những giai

đoan sau đó bi bo qua. Và tai môi giai đoan cua cái thác phân lớp đó, bô phân lớp

sau se phức tap hơn bô phân lớp trước và được xây dựng dựa trên out of basic

classifiers bơi việc sư dụng môt trong bốn thuât toán bâu chọn trọng số (weighted

voting) - Discrete Adaboost, Real Adaboost, Gentle Adaboost and Logitboost.

Những bô phân lớp cơ bản là những bô phân lớp cua cây quyết đinh với ít nhât hai

lá. Những đăc tính Haar là đâu vào đối với những bô phân lớp cơ bản. Đăc trưng đã

sư dụng trong môt bô phân lớp đăc thu được mô tả hình dáng, vi trí trong vung quan

tâm và môt ty lệ co giãn.

Anh tich phân (Integral image):

[Chesnokov Yuriy, 2008] Là môt ảnh được xư lý trước nhăm tăng cường cho việc

rut trích những đăc trưng Haar. Tai môi điêm (i, j) trong ảnh gốc, chung ta tính tông

giá tri tât cả những điêm ảnh phía bên trái và ơ trên so với điêm (i, j): I(x) = sum

sum (i, j)

Hinh 2-7: Cach tao ra anh tich phân

unsigned char** pimage;

unsigned int** pintegral_image;

for (unsigned int i = 0; i < height; i++) {

23

Page 25: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

for (unsigned int j = 0; j < width; j++) {

pintegral_image[i][j] = 0;

for (unsigned int y = 0; y <= i; y++)

for (unsigned int x = 0; x <= j; x++)

pintegral_image[i][j] += pimage[y][x];

}

}

Bang 2-1: Đoan ma cach tao ra anh tich phân

2.2.2.2. Haar cascades file

http://alereimondo.no-ip.org/OpenCV/34

Description &

References

Author(s) /

LicenceVersion Haar cascade file

Frontal Face

stump 24x24,

20x20gentle,

20x20tree

Rainer

Lienhart1.0 frontalFace10.zip

Profile Face (20x20) David Bradley 1.0 profileFace10.zip

Human body,

Pedestrian Detection

14x28 full body,

19x23 lower body,

22x18 upper body

David Bradley 1.0 body10.zip

Frontal eyes (both

eyes)

Unknown

Ref. to author

& rights is

Old cascade

format

frontalEyes35x16.zip

24

Page 26: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

welcome

Frontal eyes (both

eyes)Yusuf Bediz

New cascade

Format XML

Converted

w/HaarConv

frontalEyes35x16XML.zip

Right Eye

18x12

Reference paper

Modesto

Castrillón

Santana

Conditions of

use

1.0 REye18x12.zip

Left Eye

18x12

Reference paper

Modesto

Castrillón

Santana

Conditions of

use

1.0 LEye18x12.zip

Eyes

22x5 Eye pair

detector computed

with 7000 positive

samples

Reference paper

Modesto

Castrillón

Santana

Conditions of

use

1.0 Eyes22x5.zip

25

Page 27: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

Eyes

45x11 Eye pair

detector computed

with 7000 positive

samples

Reference paper

Modesto

Castrillón

Santana

Conditions of

use

1.0 Eyes45x11.zip

Head and shoulers

22x20 Head and

shoulders classifier

Reference paper

Modesto

Castrillón

Santana

Conditions of

use

1.0 HS22x20.zip

Mouth

25x15

Reference paper

Modesto

Castrillón

Santana

Conditions of

use

1.0 Mouth25x15.zip

Nose

25x15

Reference paper

Modesto

Castrillón

Santana

Conditions of

use

1.0 Nose25x15.zip

Eye

24x12

trained to detect one

eye (either left or

right)

Ting Shan 1.0 EyeTingShan.zip

Wall clock Celal Çaðýn 1.0 WallClock.zip

26

Page 28: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

30x30 - Message

ReferenceELGÜN

Detect eyes one at a

time 20x20shameem 1.0 oneEye22x22.zip

2.2.3. Thảo luân

Hiện nay, có 2 phương do tìm khuôn măt khác nhau như do măt trước, hay

nâng cao hơn là ơ nhiêu góc nhìn cua khuôn măt. Trong luân văn này, se tâp trung

vào quá trình rut trích thông tin, do đó chung ta chọn phương pháp phô biến nhât đó

là do tìm khuôn măt ơ măt trước (frontal view). Phương pháp này đã được phát triên

dựa trên công đồng mã nguồn mơ (OpenCV) và đã đat được những kết quả nhât

đinh.

OpenCV đã được cài đăt chay theo thời gian thực với tốc đô xư lý khoảng 20

khung hình / giây. Những máy tính có câu hình CPU 2 nhân trơ lên có thê hiệu suât

cao hơn.

27

Page 29: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

2.3. Rut Trich Thông Tin Từ Khuôn Măt

Với rut trích, chung ta có thê xem xet phương pháp đơn giản ASM đê tìm ra

mốc ranh giới (landmarks) hay những phương pháp phức tap hơn, trong đó chia

vung khuôn măt ra thành những vung nho đê rut trích đăc trưng và so sánh mâu.

2.3.1. Xác đinh vung cân quan tâm

Xác đinh mắt trước là môt lợi thế? Nhưng nếu đeo kính hay mắt nhắm thì chuyện gì

xảy ra?

Hinh 2-8: Chia vung khuôn măt thanh những vung nho hơn đê thao tac. (a) Xac đinh vung măt (b) Xac

đinh vung miêng dưa trên khoang cach măt (Eye Distance – ED)

Chung ta chia vung khuôn măt ra làm 2 phân: phân trên chứa mắt và phân

dưới chứa miệng.

Vung trên ta lai chia ra làm 2 phân theo chia ngang đê xác đinh vi trí mắt cho

chính xác. Khi chung ta biết vi trí x, y cua mắt, chung ta có thê xác đinh

được góc nghiêng cua khuôn măt và có thê cân thiết là xoay khuôn măt vê

thăng đứng với góc nghiêng đó đê tiện lợi cho việc rut trích.

28

Page 30: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

2.3.2. Những điêm đăc trưng cân rut trich

Hinh 2-9: 20 điêm đăc trưng trên khuôn măt – hinh tư BioID

29

Page 31: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

Hinh 2-10: Mô hinh 20 điêm đăc trưng trên khuôn măt

Số thứ tự ID Miêu tả

0 100 Mắt phải (right eye pupil)

1 101 Mắt trái (left eye pupil)

2 102Góc miệng phải (right mouth

corner)

3 103Góc miệng trái (left mouth

corner)

4 104Đuôi ngoài cua lông mày phải

(outer end of right eye brow)

30

Page 32: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

5 105 inner end of right eye brow

6 106 inner end of left eye brow

7 107 outer end of left eye brow

8 108 right temple

9 109 outer corner of right eye

10 110 inner corner of right eye

11 111 inner corner of left eye

12 112 outer corner of left eye

13 113 left temple

14 114 tip of nose

15 115 right nostril

16 116 left nostril

17 117centre point on outer edge of

upper lip

18 118centre point on outer edge of

lower lip

19 119 tip of chin

Bang 1-2: Những điêm đăc trưng cân rut trich

Thực vây, trong khảo sát cua [31] đã chỉ ra sự quan trọng cua đinh vi mắt trước,

cung như giup ước lượng được ty lệ (scale) cua khuôn măt.

Chung ta se xem xet bài viết này [57], cung như kết hợp [33].

[64] đã chỉ ra vài phương pháp đinh vi những điêm đăc tính trên khuôn măt:

1. Phương pháp dựa vào đăc trưng (feature based approach)

2. Phương pháp dựa vào mâu (template based approach)

Chung ta cân phân biệt giữa những phương pháp chỉ đoi hoi đinh vi những đăc tính

nhanh (rough) và những cái đoi hoi đánh giá những điêm trên khuôn măt môt cách

chính xác.

[Bartlett, 2005] So sánh LDA và SVM trong việc chọn đăc trưng (feature selection)

31

Page 33: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

[69] chỉ ra môt phương pháp rut trích những đăc trưng khu vực miệng. Đây có thê

mơ rông cho hệ thống nhân dang lời nói môt cách tự đông (automatic speech

recognition – ASR) răng môt số công trình đã thât bai do chỉ xư lý trong âm thanh

với điêu kiện tiếng ồn.

2.3.3. ASM

Active Shape Model (ASM) cô điên (theo thuât ngữ cua tôi) được trình bày bơi [75]

[75].

Môt mốc ranh giới đai diện môt điêm phân biệt hiện diện trong hâu hết các hình ảnh

đang xem xet, ví dụ như vi trí cua con ngươi trái (Hình 2-9). Do đó, chung ta đinh

vi đinh vi những mốc giới han đê tìm ra những đăc trưng khuôn măt.

Môt bô cua những mốc ranh giới se hình thành môt hình dáng. Những hình dáng

được đai diện như những vector: đó là những điêm (x, y). Chung ta se biến đôi môt

hình dáng này tới hình dáng khác thông qua những biến đôi đồng dang (tinh tiến, co

giãn, và quay) đê giảm đến mức tối thiêu khoảng cách Euclid giữa những điêm. Và

môt hình dáng trung bình là trung bình cua những hình dáng được huân luyện và

biến đôi.

ASM

Tìm kiếm quanh vi trí hiện tai cua môi điêm đê tìm ra môt điêm gân đó làm phu hợp

với mô hình (model) cua câu truc (texture) mong muốn tai mốc giới han.

2.3.3.1. Hình dáng

32

Page 34: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

Hinh 2-11: Bên trai la môt hinh dang đơn gian vơi 3 điêm.

Ơ giữa la môt mang cua hinh dang đó.

Bên phai la môt vector cua hinh dang đó

Hình dáng

2.3.3.2. Biến đôi hình dáng

Môt hình dáng được biến đôi đến hình dáng khác

2.3.3.3. Mô hình hình dáng

ds

2.4. Cơ sơ dữ liệu ảnh

- FERET database

- Cohn-Kanade database

- The Carnegie Mellon University Pose, Illumination, and Expression database

33

Page 35: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

Chương 3 - XÂY DƯNG CHƯƠNG TRÌNH

Hinh 3-12: Lược đô lơp cua chương trinh

34

Page 36: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

Xây dựng chương trình với ngôn ngữ C++, nhưng cung tham khảo cách làm

việc trên Matlab.

Code tai http://subversion.assembla.com/svn/james_research/FXFace

Yêu câu hê thông

Microsoft Windows XP/Vista Intel Pentium 4-Class (Intel Core2 Duo recommended) 512 MB RAM (1 GB RAM recommended) 30 MB free disk space Webcam

35

Page 37: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

Chương 4 - THƯ NGHIỆM

4.1. Bô Dữ Liệu Thư Nghiệm

Danh sách những bô dữ liệu cho việc thư nghiệm:

1. The Facial Recognition Technology (FERET) Database

2. CMU Face Database (CMU-MIT Frontal Face Test Set - a ground truth text

including information for locations of eyes, noses, and lip centers and tips,

however, it does not have locations of faces expressed by rectangle regions

required by the haartraining utilities as default)

3. MIT CBCL Face Data (2,429 frontal faces with few illumination variations

and pose variations)

4. BANCA Database

5. The Yale Face Database

6. Essex Face Recognition Data

7. The AR Face Database

8. The UMIST Face Database (large variations in poses)

9. The PASCAL Object Recognition Database Collection

10. 2005 OTCBVS Benchmark Dataset Collection

11. Surveillance Performance EValuation Initiative (SPEVI)

12. CMU PIE Database

13. BioID face database and the FG-NET facial expression database

36

Page 38: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

Chương 5 - KÊT LUÂN

5.1. Kết Quả

5.2. Khuyến Nghi

37

Page 39: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

TÀI LIỆU THAM KHAO

Keywords: face recognition, eye localization, asm, svm, facial features extraction,

locating facial feature points, facial feature point detection, face detection, adaboost,

floatboost, GentleBoost, gabor filter, gabor wavelet features, biometrics, geometric

invariants, xác đinh thành phân khuôn măt, trích chọn đăc trưng.

Tiếng Việt

[1] Trân Lê Hồng Du (2005), Phát Hiện Khuôn Mặt Dựa Trên Đặc Trưng Lồi

Lõm, Luân Văn Thac Sĩ, DHKHTN TpHCM, TpHCM. [pdf]

[2] Nguyên Thành Thái (2006), Nhận Dạng Mặt Người Dùng SVM và Mạng

Nơron, Luân Văn Thac Sĩ, DHCNTT TpHCM, TpHCM. [tóm tắt]

[3] Nguyên Minh Đức (2008), “VN gây tiếng vang tai diên đàn bảo mât Black

Hat”, VNExpress.net. [chi tiết]

[4] Trân Anh Tuân, Nguyên Thành Nhựt, Cao Minh Thinh,Trân Anh Tuân, Phan

Phuc Doãn, Pham Thế Bảo (2006), “Xác Đinh Các Thành Phân Cua Măt

Người Trong Anh Màu Dựa Vào Logic Mờ, Xác Xuât Và Thuât Toán

Loang”, Hôi Thao tại Trường ĐH Đà Lạt.

Tiếng Anh

[5] http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.97.4966 (Precise

eye localization through a)

[6] http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.96.1821

(EMoTracker: Eyes and Mouth Tracker Based on Energy Minimization

Criterion)

[7] http://www.eee.metu.edu.tr/~alatan/PAPER/MSbahtiyar.pdf (following the

paper)

[8] Zeeshan Ejaz Bhatti (2008), Face and Eyes Detection Using OpenCV [code]

[9] http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.43.7504

Abstract---In this paper we present a way to regard the combined face

38

Page 40: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

detection and facial feature extraction problem as an optimization problem.

This problem is of too high computational complexity to be of practical use,

and we investigate different methods to reduce the complexity. Our proposed

system uses techniques known from the literature (skin colour classifcation,

statistical pattern matching,...) as well as a novel method based on a

deformable graph and an extended Viterbi algorithm. Keywords--- Face

localization, Face detection, Facial feature extraction, Model-based coding,

Mpeg-4, Face Animation

[10] R. Beveridge, B. Draper, CSU baseline results on the FERET database, CSU

face identification evaluation system 5.0, Available from

http://www.cs.colostate.edu/evalfacerec/algorithms/version5/CSUBaselineRe

sultsV5/index.html (2003) (khảo sát vài thuât toán)

http://code.google.com/p/facerec/source/browse/?r=23

[11] http://arxiv.org/PS_cache/cs/pdf/0605/0605027v1.pdf (Recognition of

expression variant faces using masked log-Gabor features and Principal

Component Analysis)

[12] NIST, FERET evaluation, Available from

http://www.itl.nist.gov/iad/humanid/feret/perf/eval.html (2001).

[13] http://www.kung-foo.tv/gaborapi.html#2 (Gabor API) http://infinite-

sushi.com/2003/04/gabor-api-updated/

[14] http://www.personal.rdg.ac.uk/~sir02mz/CGabor/example.html (Use Gabor

Class)

[15] http://www.visagetechnologies.com/downloads.html (visage|SDK™

VISION)

[16] http://eyeteck.vn/nc-ht/dieu%20khien-tu%20dong/mang%20SVM%20va

%20ung%20dung%20trong%20nhan%20dang%20thanh%20phan%20hon

%20hop%20khi.htm (bài vê SVM)

[17] http://www.face-rec.org/algorithms/EBGM/WisFelKrue99-FaceRecognition-

JainBook.pdf

39

Page 41: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

[18] http://www.wavelet.org

[19] http://www1.cs.columbia.edu/~jebara/htmlpapers/UTHESIS/thesis.html

Tony S. Jebara, 3D Pose Estimation and Normalization for Face

Recognition (1995)

[20] http://face.360degreeweb.com/ access control software based on facial

recognition

[21] http://www.i-secure.sg/Products/faceITSDK.aspx FaceIT SDK - FaceIt

ARGUS http://identix.com/

[22] http://pages.cs.wisc.edu/~kamenick/tomoeye/final_report.html Source code

tracking eye by SVM

[23] http://faceapi.com/ (performance is very good )

[24] http://sibgrapi.sid.inpe.br/rep-/sid.inpe.br/sibgrapi@80/2007/07.18.03.11?

languagebutton=en (trang này search bài báo) Jose Gilvan Rodrigues Maia,

Fernando de Carvalho Gomes, Osvaldo de Souza - Automatic Eye

Localization in Color Images (vân đê rât thiết thực)

[25] http://s.i-techonline.com/Book/Face-Recognition/ISBN978-3-902613-03-5-

fr20.pdf Maja Pantic and Marian Stewart Bartlett. Machine Analysis of

Facial Expressions. Face Recognition, ISBN 978-3-902613-03-5, pp.558, I-

Tech, Vienna, Austria, June 2007

[26] http://s.i-techonline.com/Book/Face-Recognition/ISBN978-3-902613-03-5-

fr04.pdf Dao-Qing Dai and Hong Yan. Wavelets and Face Recognition.

Face Recognition, ISBN 978-3-902613-03-5, pp.558, I-Tech, Vienna,

Austria, June 2007

http://citeseerx.ist.psu.edu/viewdoc/versions;jsessionid=390272219CABAE

C01CD625C09B6ABC3C?doi=10.1.1.92.4220

[27] Paul Viola, Michael Jones (2001), “Rapid Object Detection using a Boosted

Cascade of Simple Features”, Proceedings of Computer Vision and Pattern

Recognition.

40

Page 42: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

http://www-cse.ucsd.edu/classes/fa01/cse291/ViolaJones.ppt

http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.6.2036 (bài cơ bản)

[28] G. Lipori, A general-to-specific Eye Locator based on Haar wavelets and

Support Vector Machines, PhD thesis, discussed in March 2007. [pdf ~ 10

Mb]

[29] P. Campadelli, R. Lanzarotti and G. Lipori, “Automatic facial feature

extraction for face recognition”, Chapter at pagg. 31-58 of the book Face

Recognition, edited by Kresimir Delac and Mislav Grgic, published by I-

Tech Education and Publishing, Vienna, July 2007. [online book] [pdf]

[30] http://www.cs.colostate.edu/evalfacerec/papers/cvprip02.pdf K. Baek, B. A.

Draper, J. R. Beveridge, and K. She. PCA vs. ICA: A comparison on the

FERET data set, presented at Joint Conference on Information Sciences,

Durham, N.C., 2002.

compare two subspace projection techniques

http://www.cs.colostate.edu/evalfacerec/papers.html

[31] P. Campadelli, R. Lanzarotti, G. Lipori, Eye localization: a survey, in the

book of The Fundamentals of Verbal and Non-verbal Communication and

the Biometrical Issue, NATO Science Series, May 2007. [pdf]

[32] http://face.nist.gov/Documents_Overview.htm Overview Face Recognition

http://frvt.org/FRGC/

[33] Danijela Vukadinovic and Maja Pantic, “Fully Automatic Facial Feature

Point Detection Using Gabor Feature Based Boosted Classifiers”, IEEE

International Conference on Systems, 2005. [pdf]

[34] Hua Gu, Guangda Su, Cheng Du, Feature Points Extraction from Faces, 2003

http://sprg.massey.ac.nz/ivcnz/Proceedings/IVCNZ_28.pdf

[35] Mäkinen Erno, Face Analysis Techniques for Human-Computer Interaction,

2007-12-14

http://acta.uta.fi/english/teos.phtml?11022

http://www.cs.uta.fi/~etm/research/ (Gabor, face detection, )

41

Page 43: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

[36] Qiong Wang, Jingyu Yang, Eye Detection in Facial Images with

Unconstrained Background, 2006

JPRR_Vol1_Issue1_2006_pp55_62_2006_09_25.pdf

[37] J.Cook, V. Chandran & S.Sridharan, “Multi-Scale Representation for 3D

Face Recognition“, in IEEE Transactions on Information Forensics ans

Security: Special Issue on Human Detection and Recognition, 2007

http://jamie.homelinux.org/wp-content/uploads/2007/03/cook-07-multi-

scalerepresentationfor3dfacerecognition.pdf (download website)

[38] Recent Advances in Face Recognition

Edited by: Kresimir Delac, Mislav Grgic and Marian Stewart Bartlett

ISBN 978-953-7619-34-3

Publisher: IN-TECH, Vienna, Austria

Publication date: December 2008

URL: http://intechweb.org/book.php?id=101

[39] Jahmar Ignacio - Constructing Individual Facial Expressions in an Avatar

from Observation (Slide – tao avatar)

http://ml.cecs.ucf.edu/meli/MLII/files/Ignacio_Pres_Final.pdf

[40] Fei Zuo, Peter H. N. de With (2005), “Real-time Face Recognition for Smart

Home Applications”, International Conference on Consumer Electronics

(ICCE2005), vol. 51 p. 183-190, February 2005, Las Vegas, U.S.A. [pdf]

[details] [others] (mục đích này rât hay)

http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.59.3603

[41] Aysegul Gunduz, Hamid Krim (2003), “Facial feature extraction using

topological methods”, Raleigh.

http://www.busim.ee.boun.edu.tr/~cdemirkir/files/FacialFeatureDetection/

cr2304.pdf

(có nói lý do essential in many modern multimedia applications such as face

recognition, facial gesture recognition, and low-bit video coding. These

42

Page 44: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

applications play an important role in security systems, human-computer

interaction, and teleconferencing)

[42] Mohammad H. Mahoor, Mohamed Abdel-Mottaleb†, and A-Nasser Ansari

(2006), “Improved Active Shape Model for Facial Feature Extraction in

Color Images”, Journal of multimedia, Vol. 1.

www.academypublisher.com/jmm/vol01/no04/jmm01042128.pdf

[43] Mark Everingham, Josef Sivic and Andrew Zisserman, “Hello! My name is...

Buffy – Automatic Naming of Characters in TV Video”, Proceedings of the

17th British Machine Vision Conference (BMVC 2006). [pdf] [details]

[44] Timo Ahonen, Abdenour Hadid and Matti Pietikäinen (2004), Face

Recognition with Local Binary Patterns, Filand.

http://www.springerlink.com/content/p5d9xp9gfkex5gk9/ (Face Recognition

with Local Binary Patterns-Timo.pdf)

[45] Hyun-Chul Kim, Hyoung-Joon Kim, Wonjun Hwang, Seok-Cheol Kee and

Whoi-Yul Kim (2007), “Facial Feature Point Extraction Using the Adaptive

Mean Shape in Active Shape Model”, Seoul, Korea.

http://www.springerlink.com/content/4828k6141231741u/#ContactOfAuthor

4 (HWJ_07C_MIRAGE.pdf)

[46] Lê Đình Duy (2006), Human Face Processing Techniques with Application

to Large Scale Video Indexing, PhD Thesis, Tokyo, Japan. [pdf] [details]

[blog]

[47] Rudy Adipranata, Cherry G. Ballangan, Silvia Rostianingsih, Ronald Paska

Ongkodjodjo , “Real-Time Human Face Tracker Using Facial Feature

Extraction”,Surabaya, Indonesia

http://fportfolio.petra.ac.id/user_files/99-015/104.pdf (human tracker.pdf)

(sư dụng phương pháp SkinColor)

[48] Jeremy N. Bailensona, Emmanuel D. Pontikakis, Iris B. Mauss, James J.

Gross, Maria E. Jabon, Cendri A.C. Hutchersond, Clifford Nass, Oliver John

43

Page 45: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

(2007), “Real-time classification of evoked emotions using facial feature

tracking and physiological responses”, USA. [pdf]

[49] Platform for developing 3-D virtual reality worlds, web. Address at

http://www.worldviz.com/products/vizard/index.html.

[50] H. K. Ekenel, H. Gao, R. Stiefelhagen, "3-D Face Recognition using Local

Appearance-Based Models", IEEE Transactions on Information Forensics

and Security, Vol. 2, No. 3, pp. 630-635, September 2007.

[51] J. Stallkamp, H.K. Ekenel, R. Stiefelhagen, "Video-based Face Recognition

on Real-World Data", International Conference on Computer Vision

(ICCV'07), Rio de Jenario, Brasil, October 2007.

[52] H.K. Ekenel, J. Stallkamp, H. Gao, M. Fischer, R. Stiefelhagen, "Face

Recognition for Smart Interactions", International Conference on Multimedia

& Expo, Beijing, China, July 2007.

[53] H.K. Ekenel, M. Fischer, R. Stiefelhagen, "Face Recognition in Smart

Rooms", 4th MLMI, Brno, Czech Republic, June 2007.

[54] H.K. Ekenel, M. Fischer, Q. Jin, R. Stiefelhagen, "Multi-modal Person

Identification in a Smart Environment", CVPR Biometrics Workshop,

Minneapolis, USA, June 2007.

[55] H.K. Ekenel, R. Stiefelhagen, "Local Wavelet Analysis for Face

Recognition", IEEE Signal Processing and Communications Applications

Conference, Eskisehir, Turkey, June 2007

[56] H.K. Ekenel, R. Stiefelhagen, "Two-class Linear Discriminant Analysis for

Face Recognition", IEEE Signal Processing and Communications

Applications Conference, Antalya, Turkey, June 2007.

[57] H.K. Ekenel, R. Stiefelhagen, "An Un-awarely Collected Real World Face

Database: The ISL-Door Face Database", International Conference on

Computer Vision Systems, ICVS 2007, Bielefeld, Germany, March 2007.

[58] Minh Hoai Nguyen, Joan Perez, Fernando De la Torre (2008), “Facial

Feature Detection with Optimal Pixel Reduction SVMs”, 8th IEEE Int’l

44

Page 46: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

Conference on Automatic Face and Gesture Recognition, September 2008,

Amsterdam, The Netherlands. [pdf] [details]

[59] Steve Milborrow and Fred Nicolls (2007), “Locating Facial Features with an

Extended Active Shape Model”, ECCV '08: Proceedings of the 10th

European Conference on Computer Vision, 5305, 504-513, Marseille,

France. [pdf] [details]

[60] Kuang-chih Lee (2005), The Extended Yale Face Database B (web). Address

at

http://vision.ucsd.edu/~leekc/ExtYaleDatabase/download.html

http://vision.ucsd.edu/~leekc/ExtYaleDatabase/ExtYaleB.html

[61] Daniel Riccio, Jean-Luc Dugelay (2007), Geometric invariants for 2D/3D

face recognition. [pdf]

[62] Deva Ramanan, Simon Baker and Sham Kakade (2007), "Leveraging

Archival Video for Building Face Datasets", International Conference on

Computer Vision (ICCV), Rio de Janeiro, Brazil, Oct 2007. [pdf] [details]

[63] Stan Z. Li, Senior Member, Zhenqiu Zhang (2004), “FloatBoost Learning

and Statistical Face Detection”, IEEE Transactions on Pattern Analysis and

Machine Intelligence. [pdf]

[64] Stefano Arca, Paola Campadelli, Raffaella Lanzarotti (2005), “A face

recognition system based on automatically determined facial fiducial points”,

Pattern Recognition Journal. [pdf]

[65] P. Campadelli, R. Lanzarotti, G. Lipori, E. Salvi, “Face and facial feature

localization”, In the Proceedings of the International Conference on Image

Analysis and Processing (ICIAP 2005). [pdf]

[66] Andrea F. Abate, Michele Nappi, Daniel Riccio, Gabriele Sabatino (2007),

“2D and 3D face recognition: A survey”

[67] Paul Viola, Michael J. Jones (2004), “Robust real-time face detection”,

International Journal of Computer Vision 57(2), 137–154, 2004. [pdf]

45

Page 47: 110137188-BaoCaoLuanVan-TrinhDinhDuy-CH0601013-1

[68] Jake Newman (2009), Visual-Only Language Identication, Thesis at

University of East Anglia. [pdf]

[69] Roland Gocke, J Bruce Millar, Alexander Zelinsky, and Jordi Robert-Ribes

(2000), “Automatic Extraction of Lip Feature Points”, Proceedings of

Australian Conference on Robotics and Automation (ACRA2000) [ps, demo]

[70] Ce Zhan, Wanqing Li, Philip Ogunbona, and Farzad Safaei

(2007), “Real-Time Facial Feature Point Extraction”, PCM

2007 (under review)

[71] Rainer Lienhart, Jochen Maydt (2002), “An Extended Set of Haar-like

Features for Rapid Object Detection”, in: Proceedings of the International

Conference on Image Processing, vol. 1, pp. I–900–I–903. [pdf]

[72] Gwen Littlewort, Marian Stewart Bartlett, Ian Fasel, Joshua Susskind, Javier

Movellan (2004), “Dynamics of facial expression extracted automatically

from video”, cvprw, vol. 5, pp.80, 2004 Conference on Computer Vision and

Pattern Recognition Workshop (CVPRW'04) Volume 5, 2004.

[73] O. Jesorsky, K. Kirchberg, and R. Frischholz (2001), “Robust Face Detection

using the Hausdor Distance”, In J. Bigun and F. Smeraldi, editors, Audio and

Video based Person Authentication - AVBPA. Springer, 2001.

www.bioid.com/downloads/facedb.

[74] P. H. Hennings-Yeomans, S. Baker, and B. V. K. V. Kumar (2008),

“Simultaneous super-resolution and feature extraction for recognition of low-

resolution faces”, IEEE Conference on Computer Vision and Pattern

Recognition. Pages 1-8,  June 2008. [in the press]

[75] T. F. Cootes and C. J. Taylor (2004), “Technical Report: Statistical Models

of Appearance for Computer Vision”, The University of Manchester School

of Medicine, 2004.

http://www.face-rec.org/algorithms/AAM/app_models.pdf

46