RからGoogle Cloud Vision API を利用する

からGoogle

CloudVisionAPIを使う

Tokyo.R #67

簑田高志

目次

1. 自己紹介

2. Google Cloud Vision APIとは

3. 使い始める前の準備

4. Rでの設定

5. 実際にうごかしてみる

6. まとめ

• 名前簑田高志• Twitter aad34210• ブログ http://pracmper.blogspot.com/

• 仕事？？？E-commerceのビジネスアナリスネット広告のビジネスアナリスト

• 出版書籍みんなのR（共同翻訳）データサイエンティストのための最新

知識と実践 Rではじめよう! [モダン]なデータ分析

自己紹介

2. Google Cloud Vision APIとは

こんなことありませんか?

• 写真に写っている場所がどこかを判定したい

答え：フランスモン・サン・ミッシェル出展：http://farm2.static.flickr.com/1317/1314684944_29ac3169d2.jpg



答え：アメリカ自由の女神出展： http://farm1.static.flickr.com/142/325436657_ef71ab8285.jpg



答え：エジプトギザの大ピラミッド出展： http://www.wallpaperlink.com/bin/0707/03586.html


• ロゴ抜き出したい…（なんのロゴか抜きたい）

マクドナルドのロゴ抜き出したい出展： https://tabelog.com/kanagawa/A1401/A140101/14029083/dtlphotolst/4/smp2/


• ロゴ抜き出したい…（何社あるのこれ…）

出展： http://flovv.github.io/Brand-Logos/


• 写っているテキストを抜き出したい

出展：https://store.shopping.yahoo.co.jp/top1-price/20160916-mens-socks4.html

でも…大量の画像の”目視”だとツラミしかない


コンピュータにやらせてみましょう！

出展：https://www.pakutaso.com/20130608171post-2947.html

しかもRから！

Google Cloud Visionですよ

出展： https://cloud.google.com/vision/?hl=ja

Google Cloud Visionとは？

• Google Cloud Vision API は、使いやすい REST API にパワフルな機械学習モデルが組み込まれており、画像の内容を認識するアプリケーションの開発を可能にします。Google Cloud Vision API は、膨大な数のカテゴリ（「ヨット」や「ライオン」、「エッフェル塔」など）に各画像を素早く分類する機能や、画像内の個々の物体や人の顔を検出する機能、画像内に含まれているテキストを検出して読み取る機能を備えています。また、画像カタログのメタデータ作成、不適切なコンテンツの管理、画像の感情分析を通じた新しいマーケティング手法の導入が可能になります。リクエストでアップロードされた画像を分析することも、Google Cloud

Storage の画像ストレージに統合することもできます。

画像の中身を解析してくれるAPI

出展： https://cloud.google.com/vision/?hl=ja

（Google Cloud Vision APIより）

どんなことができるか？

•ラベル検出•ロゴ検出•ランドマーク検出•文字認識（OCR）•顔検出•画像属性• Web検出

ツラミに勝てる！

出展： https://www.pakutaso.com/20130113011post-2313.html

3. 使い始める前の準備

必要なもの

• Google Cloud Platform アカウント

• クレジットカード（支払いするため）

• Cloud Vision APIの認証情報

• R / RStudio

Google Cloud Platform 認証設定

• Google Cloud Platform アカウントが利用できるようになったら、以下の画面が表示されます。

• 検索から「Cloud Vision API」を検索

※2018/01/20時点


• 「有効にする」ボタンをクリックする

※2018/01/20時点


• APIとサービスの画面が表示される• 再度バーの「認証情報」をクリック

※2018/01/20時点


• 認証情報を作成。• 今回はOAuthクライアントIDを作成

※2018/01/20時点


• 認証情報を作成終わったらJSONをダウンロードしておく

※2018/01/20時点

4. Rでの設定

Rのパッケージのインストール

• 必要なパッケージをインストールする• RoogleVision パッケージを使う

##packages

install.packages("tidyverse")

install.packages("leaflet")

install.packages("devtools")

install.packages("jsonlite")

devtools::install_github("flovv/RoogleVision")

source("http://bioconductor.org/biocLite.R")

biocLite("EBImage")

##library

library(tidyverse)

library(leaflet)

library(RoogleVision)

library(EBImage)

library(jsonlite)

認証

• さきほどGoogle Cloud Platform側で設定した認証情報を使ってR側で認証• ブラウザが立ち上がりアカウントの紐付けを行う

creds = fromJSON(’hoge/foo/bar/~~.json‘) ## 認証JSONファイルのパス

options("googleAuthR.client_id" = creds$web$client_id)

options("googleAuthR.client_secret" = creds$web$client_secret)

options("googleAuthR.scopes.selected" =

c("https://www.googleapis.com/auth/cloud-platform"))

googleAuthR::gar_auth()

5. 実際にうごかしてみる

APIアクセス関数

• 一つの関数を使う。パラメータ内で複数機能の切り替え

getGoogleVisionResponse(imagePath,

feature = "LABEL_DETECTION",

numResults = 5)

※ feature =

(FACE_DETECTION（顔認識）, LANDMARK_DETECTION（場所認識）, LOGO_DETECTION（ロゴ認識）, LABEL_DETECTION（ラベル認識）, TEXT_DETECTION(テキスト))

場所の特定

• 自由の女神を特定してみる

出展： http://farm1.static.flickr.com/142/325436657_ef71ab8285.jpg

場所の特定

• 自由の女神を特定してみる

gcv_result <- getGoogleVisionResponse('statue_of_liberty.jpg', feature = 'LANDMARK_DETECTION')

head(gcv_result)

mid description score vertices

locations1 /m/072p8 Statue of Liberty 0.9103001 98, 252, 252, 98, 40, 40, 486, 486 40.68926, -74.04448

場所の特定

• ピラミッドを特定してみる

出展： http://www.wallpaperlink.com/bin/0707/03586.html

場所の特定

• ピラミッドを特定してみる

gcv_result <- getGoogleVisionResponse(Pyramid.jpg', feature = 'LANDMARK_DETECTION')

head(gcv_result)

mid description score

vertices locations1 /m/036mk Great Pyramid of Giza 0.6733159 12, 947, 947, 12, 434, 434, 536, 536 29.97394, 31.13111

場所の特定(マッピング)

• ピラミッドを地図上にマッピングしてみる。

latt <- gcv_result$locations[[1]][[1]][[1]]

lon <- gcv_result$locations[[1]][[1]][[2]]

m <- leaflet() %>% addProviderTiles(providers$CartoDB.Positron)

%>% setView(lng = lon, lat = latt, zoom = 5)

%>% addMarkers(lng = lon, lat = latt)

m

場所の特定(マッピング)

• ピラミッドを地図上にマッピングしてみる。

latt <- gcv_result$locations[[1]][[1]][[1]]

lon <- gcv_result$locations[[1]][[1]][[2]]

m <- leaflet() %>% addProviderTiles(providers$CartoDB.Positron)

%>% setView(lng = lon, lat = latt, zoom = 5)

%>% addMarkers(lng = lon, lat = latt)

m

ロゴの特定

• たくさんあるロゴを抽出


ロゴの特定

gcv_result <- getGoogleVisionResponse(brandlogos.png', feature = LOGO_DETECTION ’ , numResults = 100)

head(gcv_result)

mid description score vertices1

/m/011spz0k The Guardian 0.5160552 213, 345, 345, 213, 173, 173, 443, 4432 /m/05b8qj Ray-Ban 0.4531192 213, 439, 439, 213, 92, 92, 255, 2553 /m/02q67s7 Colgate 0.4450404 478, 566, 566, 478, 13, 13, 44, 444 /m/03p39x1 Tesco Lotus 0.4292877 40, 140, 140, 40, 353, 353, 390, 3905 <NA> Heinz 0.4222758 693, 772, 772, 693, 16, 16, 42, 426 /g/1x5qtdq7 Cadbury Adams 0.4195638 290, 374, 374, 290, 296, 296, 320, 3207 /m/03lzc9 Special K 0.4150487 471, 568, 568, 471, 411, 411, 449, 4498 <NA> Walmart 0.4131395 372, 453, 453, 372, 353, 353, 384, 384

• たくさんのロゴは特定できないもよう…。（8個まで特定できた）• numResults で結果をコントロールできる

ロゴの特定

• 特定のロゴを抽出

出展： https://tabelog.com/kanagawa/A1401/A140101/14029083/dtlphotolst/4/smp2/

ロゴの特定

gcv_result <- getGoogleVisionResponse(macdonald_logo.jpeg', feature = LOGO_DETECTION ’)

head(gcv_result)

error1

No features detected!

• たくさんのロゴは特定できないもよう…。（8個まで特定できた）• numResults で結果をコントロールできる

残念！！！

テキスト抜き出し

• 画像中のテキストを抜き出したい

出展：https://store.shopping.yahoo.co.jp/top1-price/20160916-mens-socks4.html

テキスト抜き出し

• 画像中のテキストを抜き出したい

gcv_result <- getGoogleVisionResponse(’ socks_image_text.jpeg', feature = TEXT_DETECTION ’)

head(gcv_result)

6. まとめ

まとめ

1. Google Cloud Vision APIを使えば画像の「内容」を検出できる。

2. GCPの認証を取得

3. RoogleVision パッケージを使う

4. 場所の特定、ロゴの検出、テキスト検出ができることを確認できた。

5. 大量の画像もこのAPIを使えば、作業が楽になりそう。

参考資料

• https://github.com/cloudyr/RoogleVision• https://www.r-bloggers.com/google-vision-api-in-r-rooglevision/• http://code.markedmondson.me/googleAuthR/articles/google-

authentication-types.html

https://github.com/cloudyr/RoogleVision

https://www.r-bloggers.com/google-vision-api-in-r-rooglevision/

http://code.markedmondson.me/googleAuthR/articles/google-authentication-types.html

ご静聴ありがとうございました

RからGoogle Cloud Vision API を利用する

Data & Analytics