Top Banner
Large-scale Semantic Visual Search NGUYEN ANH TUAN [email protected] 2016/07/17
16

今日から始める人工知能 × 機械学習 Meetup ライトニングトーク1

Jan 22, 2018

Download

Technology

Nguyen Tuan
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: 今日から始める人工知能 × 機械学習 Meetup ライトニングトーク1

Large-scale Semantic Visual Search

NGUYEN ANH [email protected]

2016/07/17

Page 2: 今日から始める人工知能 × 機械学習 Meetup ライトニングトーク1

About me• 東京大学 情報理工学系研究科修士2年生

• テーマ:Object Retrieval,情報検索等

• 趣味:水泳,囲碁• ブログ:

https://imsmarxen68.tumblr.com/

NGUYEN ANH TUAN 東京大学・情報理工・修士2年生

Page 3: 今日から始める人工知能 × 機械学習 Meetup ライトニングトーク1

A picture is worth a thousand words

Page 4: 今日から始める人工知能 × 機械学習 Meetup ライトニングトーク1

Outline• Semantic Visual Search

• A visual search frameworkImage credits: http://ai.stanford.edu/~jkrause/cars/car_dataset.html

Feature extraction

Featureaggregation

Featurematching Re-ranking

Preliminaryresults

Finalresults

NGUYEN ANH TUAN 東京大学・情報理工・修士2年生

Page 5: 今日から始める人工知能 × 機械学習 Meetup ライトニングトーク1

Visual search

Image credits: http://ai.stanford.edu/~jkrause/cars/car_dataset.html

Image credits: http://google.com

NGUYEN ANH TUAN 東京大学・情報理工・修士2年生

Page 6: 今日から始める人工知能 × 機械学習 Meetup ライトニングトーク1

What’s the problem?• Semantic difficulties: fine-grained differences

Image credits: http://ai.stanford.edu/~jkrause/cars/car_dataset.html

NGUYEN ANH TUAN 東京大学・情報理工・修士2年生

Page 7: 今日から始める人工知能 × 機械学習 Meetup ライトニングトーク1

But for search problem?Image credits: http://ai.stanford.edu/~jkrause/cars/car_dataset.html

Query Database

NGUYEN ANH TUAN 東京大学・情報理工・修士2年生

Page 8: 今日から始める人工知能 × 機械学習 Meetup ライトニングトーク1

But for search problem?Image credits: http://ai.stanford.edu/~jkrause/cars/car_dataset.html

Query Database

0.1

0.5

0.2Ranking problem with a variation of

fine-grained changes

NGUYEN ANH TUAN 東京大学・情報理工・修士2年生

Page 9: 今日から始める人工知能 × 機械学習 Meetup ライトニングトーク1

But for search problem?Image credits: http://ai.stanford.edu/~jkrause/cars/car_dataset.html

Query Database

0.1

0.5

0.2Find visual representations to capture all fine-grained local information in images

NGUYEN ANH TUAN 東京大学・情報理工・修士2年生

Page 10: 今日から始める人工知能 × 機械学習 Meetup ライトニングトーク1

Large-scale Visual Search

Page 11: 今日から始める人工知能 × 機械学習 Meetup ライトニングトーク1

Robust feature extraction

• Robust to– Scale changes– Rotation and affine changes– Blur, sharpening, …

Feature extraction

Featureaggregation

Featurematching Re-ranking

Preliminaryresults

Finalresults

Image credits: http://ai.stanford.edu/~jkrause/cars/car_dataset.html

A picture is worth a

thousand words

NGUYEN ANH TUAN 東京大学・情報理工・修士2年生

Page 12: 今日から始める人工知能 × 機械学習 Meetup ライトニングトーク1

Statistical kernels

• Bag-of-Features (BoF)• Fisher kernel (GMM) [1]

• VLAD (K-means) [2]

Image credits: http://www.mathworks.com/matlabcentral/

Feature extraction

Featureaggregation

Featurematching Re-ranking

Preliminaryresults

Finalresults

[1] F. Perronnin, C. Dance, “Fisher Kernels on Visual Vocabularies for Image Categorization,” in Proc. CVPR, IEEE, 2007[2] H. Jegou, F. Perronnin, M. Douze, J. Sanchez, P. Perez, C. Schmid, “Aggregating Local Image Descriptors into Compact Codes,” IEEE Trans. Pattern Anal. Mach. Intell. 34 (2012) 1704–1716. NGUYEN ANH TUAN 東京大学・情報理

工・修士2年生

Page 13: 今日から始める人工知能 × 機械学習 Meetup ライトニングトーク1

Statistical kernelsFeature

extractionFeature

aggregationFeature

matching Re-ranking

Preliminaryresults

Finalresults

NGUYEN ANH TUAN 東京大学・情報理工・修士2年生

Page 14: 今日から始める人工知能 × 機械学習 Meetup ライトニングトーク1

Image matching = Feature matching

• Feature matching→Nearest Neighbor Search– Inverse Search with Inverted Indices– Compressed data for better memory usage [3]

Feature extraction

Featureaggregation

Featurematching Re-ranking

Preliminaryresults

Finalresults

[3] H. Jégou, M. Douze, C. Schmid, Product quantization for nearest neighbor search., IEEE Trans. Pattern Anal. Mach. Intell. 33 (2011) 117–28. Data CompressionNGUYEN ANH TUAN 東京大学・情報理

工・修士2年生

Page 15: 今日から始める人工知能 × 機械学習 Meetup ライトニングトーク1

Verification

• Geometry verification– RANSAC methods [4]– Reduce the number of good inliers

Image credits: http://ai.stanford.edu/~jkrause/cars/car_dataset.html

Feature extraction

Featureaggregation

Featurematching Re-ranking

Preliminaryresults

Finalresults

[4] M.A. Fischler, R.C. Bolles, Random sample consensus: a paradigm for model fitting with applications to image analysis and automated cartography, Commun. ACM. 24 (1981) 381–395. NGUYEN ANH TUAN 東京大学・情報理

工・修士2年生

Page 16: 今日から始める人工知能 × 機械学習 Meetup ライトニングトーク1

Thank you for listening