Top Banner
1 自自自自自自 2007 自自 20 自 1 自 7 自 ( 自自自自自自自 自自自自自自自自自自自自自 自自自自
56

自然言語処理 2007

Jan 08, 2016

Download

Documents

Nitesh

自然言語処理 2007. 平成 20 年 1 月 7 日 ( 月) 東京工科大学 コンピュータサイエンス学部 亀田弘之. 今までやってきたこと. 今までやってきたこと. 自然言語処理とは 自然言語処理(理解)過程の概要 形態素解析(各種手法とツール) 構文解析 言語獲得(文法獲得). 自然言語処理とは. 自然言語 (Natural Languages) 言語 思考のための道具 情報・知識を記述・蓄積するための道具 コミュニケーションのための道具 言語=自然言語+人工言語 自然言語=文字言語+音声言語+視覚言語 処理=理解+生成 - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: 自然言語処理 2007

1

自然言語処理 2007

平成 20 年 1 月 7 日 ( 月)東京工科大学コンピュータサイエンス学部 亀田弘之

Page 2: 自然言語処理 2007

2

今までやってきたこと

Page 3: 自然言語処理 2007

3

今までやってきたこと

自然言語処理とは 自然言語処理(理解)過程の概要 形態素解析(各種手法とツール) 構文解析 言語獲得(文法獲得)

Page 4: 自然言語処理 2007

4

自然言語処理とは

自然言語 (Natural Languages) 言語

思考のための道具 情報・知識を記述・蓄積するための道具 コミュニケーションのための道具

言語=自然言語+人工言語 自然言語=文字言語+音声言語+視覚言語

処理=理解+生成 処理の主体(機械 or 人間)

本授業は主として「文字言語+理解」を取り扱う

Page 5: 自然言語処理 2007

5

自然言語処理(理解)過程の概要

形態素解析 (Morpheme analysis) 構文解析 (Syntactic analysis) 意味解析 (Semantic analysis) 談話解析 (Discourse analysis) 状況解析 (Situation analysis)

Page 6: 自然言語処理 2007

6

形態素解析の手法 文字種法 最長一致法 文節数最少法 接続表を利用する方法 遷移確率を用いる方法 コスト最小法 (Juman) 隠れマルコフモデル法 (Chasen) その他 (Kabocha 等は SVM を利用 )

SVM: Support Vector Machine(機械学習法の1つ )

Page 7: 自然言語処理 2007

7

形態素解析のツール

Juman Chasen (茶筌) Kobako/J その他いろいろあります

( Internet などで調べてみましょう.) 自作のソフトウェア

Page 8: 自然言語処理 2007

8

統語解析

言語・文法言語=文法的に適格な文の集合文法= <Vn, Vt, s, P>

Vn: 非終端記号の集合Vt: 非終端記号の集合s: 開始記号P : 書き換え規則群

(チョムスキーの文法理論に準拠)

Page 9: 自然言語処理 2007

9

統語解析 言語・文法

言語=文法的に適格な文の集合文法= <Vn, Vt, s, P>

Vn: 非終端記号の集合(構文構造記述用文法用語集)

Vt: 終端記号の集合(語彙)s: 開始記号P : 書き換え規則群

(チョムスキーの文法理論に準拠)

Page 10: 自然言語処理 2007

10

Tom broke the cup with the hammer.

Page 11: 自然言語処理 2007

11

言語獲得(文法獲得)

未知語獲得( Vt の拡張) 統語規則獲得 (Vn およびPの拡張 )

Page 12: 自然言語処理 2007

12

未知語獲得

定義 分類

Page 13: 自然言語処理 2007

13

未知語の定義

人間にとっての未知語:初見の単語?(定義困難?)

機械にとっての未知語:システム辞書に登録されていない単語(未登録語)

Page 14: 自然言語処理 2007

14

未知語の分類(概要)

第1種の未知語(異表記未知語) 第2種の未知語(未知複合語) 第3種の未知語(その他)

Page 15: 自然言語処理 2007

15

第1種(異表記未知語)1. 東京大学付属病院  東京大學附属病院2. 組合せ 組み合せ 組み合わせ 組み合わ

せ3. 飛び込む  飛びこむ4. コンピュータ  コンピューター etc.

Page 16: 自然言語処理 2007

16

第 2 種(未知複合語)

1. 数学辞典2. 見学旅行3. 個人旅行4. 月旅行5. 温泉旅行6. 積み立て旅行 etc.

これらの単語を辞書で調べてみよう.このうちの幾つかは通常の辞書には載っていない.そのような語は他にもあり得る.どうすればいいのだろうか?

Page 17: 自然言語処理 2007

17

第3種

その他 のだめ rlgg モー娘

Page 18: 自然言語処理 2007

18

未知語処理

要素プロセス 処理モード 処理方略

Page 19: 自然言語処理 2007

19

未知語処理の要素プロセス

1. 未知語存在の検出2. 未知語候補の切り出し3. 内部構造の解析4. 品詞推定5. 意味推定6. 意味整合性の確認7. 辞書処理(追加・削除・更新 など)

Page 20: 自然言語処理 2007

20

未知語処理の処理モード

処理モード 未知語 未知統語規則

モード1 無 無

モード2 有 無

モード 3 無 有

モード 4 有 有

Page 21: 自然言語処理 2007

21

今日の内容

より深い自然言語処理 他者理解

感情・意図理解(・社会認知?) 心のモデル(・認知機能モデル?)

Page 22: 自然言語処理 2007

22

心のモデルとそれに基づく感情・意図推測方法

2006 年 10 月 20 日

東京工科大学亀田弘之・小澤朋之・難波創

電子情報通信学会思考と言語研究会平成 19年 10月 20日発表資料

於 NHK基礎研究所

Page 23: 自然言語処理 2007

23

はじめに( 1/5 )

いじめ 引きこもり心の問題

社会の高度化・複雑化

「癒し」を切実に求めている

Page 24: 自然言語処理 2007

24

はじめに( 2/5 )

癒し心理的効果

人を元気づけることや動機づける

生理的効果ストレスを低減し血圧や脈拍を正常にさせる

現代社会に必要とされている

Page 25: 自然言語処理 2007

25

はじめに( 3/5 )

PaPeRo ifbot

人との共存を目的として開発されているロボット

人に安らぎや癒しを与えることができる

Page 26: 自然言語処理 2007

26

はじめに( 4/5 )

ふれあい癒される~

円滑で自然な意思疎通が必要不可欠

Page 27: 自然言語処理 2007

27

コミュニケーションによる癒しの実現人とふれあう癒し系ロボット PDDIN

PDDIN ですよろしく~♪

はじめに( 5/5 )

Page 28: 自然言語処理 2007

28

従来の心・感情モデル( 1/5 )

“人の心”という概念を扱う場合に,まさにその心自体を記述・表現するためのものである

心のモデル

心のモデルに関するさまざまな提案がされている

Page 29: 自然言語処理 2007

29

従来の心・感情モデル( 2/5 )

図 1 :心の計算機モデル(岡田直之)

Page 30: 自然言語処理 2007

30

従来の心・感情モデル( 3/5 )

図 2 :意識の外にある無意識の自律分散計算結果にボトムアップに注意を払う受動的な意識を仮定する心のモ

デル(前野隆司)

Page 31: 自然言語処理 2007

31

従来の心・感情モデル( 4/5 )

図 3 :感情の立体モデル( P.Plutchik )

Page 32: 自然言語処理 2007

32

The Theory of Mind (心の理論)

Premack & Wooddruff(1978) Baron-Cohen(1995)

Page 33: 自然言語処理 2007

33

心の理論とは

Page 34: 自然言語処理 2007

34

The Theory of Mind

ID (Intentionality Detector)意図検出器

EDD (Eye-Direction Detector)視線方向検出器

SAM (Shared Attention Mechanism)共有注意の機構

ToMM (Theory of Mind Mechanism)心の理論の機構

Page 35: 自然言語処理 2007

35

従来の心・感情モデル( 5/5 )

1.処理のためのデータ構造やアルゴリズムが明確に示してはいない

2.工学的に応用するまでに至っていない

従来のモデルの問題点

人とふれあう癒し系ロボット PDDINの研究・開発による心のモデルの考案

Page 36: 自然言語処理 2007

36

PDDIN

2002 年度から開発されている

1.感情モデルの提案2.感情モデルをもちいた,感情システムの構築

研究内容

4.ロボット本体の作製

3.対話処理システムの構築

Page 37: 自然言語処理 2007

37

PDDIN2005 デモムービー

Page 38: 自然言語処理 2007

38

考察

モデルの意義の一つは「システムの設計図」である。

従来の心・感情のモデルは設計図としては不十分。

というのも…

Page 39: 自然言語処理 2007

39

ソフトウェア工学の分野では、「大規模化・複雑化した情報システム」に対して、様々な観点から分析・記述・設計

人間の心(脳)も同様ではないのか?

Page 40: 自然言語処理 2007

40

ソフトウェア工学で使用する図(UML)

1. ユースケース図2. クラス図3. オブジェクト図4. シーケンス図5. ステートマシン図(ステートチャート図)

6. アクティビティ図7. コンポーネント図

8. コミュニケーション図(コラボレーション図)

9. 配置図10. コンポジット図11. タイミング図12. 相互作用概念図

こんなにたくさんある!

Page 41: 自然言語処理 2007

41

UML での各種ビュー

ユースケース図 アクティビティ図シーケンス図

コミュニケーション図(コラボレーション図)

ステートマシン図(ステートチャート)

クラス図オブジェクト

コンポーネント図

配置図

ユースケースビュー

論理ビュー

配置ビュー

並行性ビュー

コンポーネントビュー

こんなにたくさんの視点がある!

Page 42: 自然言語処理 2007

42

人間の心(脳)に対しても、 UML を参考にしてモデルを記述するべきであろう。

(今後の方針)

Page 43: 自然言語処理 2007

43

心のモデル

計算論的なモデルが必要(今回の基本的主張)

Page 44: 自然言語処理 2007

44

記憶のモデル(従来のモデルの例)

銘記 保持 想起

感覚貯蔵庫 短期記憶 長期記憶

Page 45: 自然言語処理 2007

45

心のモデル

データ構造+アルゴリズム

知識表現+プログラム(オブジェクト指向)

Page 46: 自然言語処理 2007

46

心のモデルの概要図

Page 47: 自然言語処理 2007

47

心のモデルの知識表現

Page 48: 自然言語処理 2007

48

心のモデルのプログラム

Page 49: 自然言語処理 2007

49

心のモデルのプログラム

理解と生成 生成はシステム設計者依存 理解は相手がある->この解決方法は?

Page 50: 自然言語処理 2007

50

心のモデルのプログラム

理解と生成 生成:生成関数 F を利用 理解:生成関数 F の逆関数で推定

逆関数の存在は? 逆関数の同定(作成)方法は? 逆関数の計算は?

解決すべき問題はたくさんある!どうすればいいのか!?

Page 51: 自然言語処理 2007

51

刺激 A

反応 B

Page 52: 自然言語処理 2007

52

D:心の状態A:発話+仕草F: D → A

D:心の状態A:発話+仕草F: D → A

同一視

図6.心のモデルの共通仮説

心のメカニズムは共通

Page 53: 自然言語処理 2007

53

生成関数 F の定義

刺激 X 心の状態 Y 反応

F(X,Y)

α A F1

α B F2

β A F3

β B F4

γ A F5

γ B F6

Page 54: 自然言語処理 2007

54

まとめ 癒しを実現するためには心のモデルが重

要(他者理解なくしては癒しなし!)

計算論的心のモデルが必要 計算論的とは、

知識表現+プログラム 心のモデルの提案

知識表現+プログラム 他者理解の方法

( IbS: Inference by Synthesis )

Page 55: 自然言語処理 2007

55

The Theory of Mind

ID (Intentionality Detector)意図検出器

EDD (Eye-Direction Detector)視線方向検出器

SAM (Shared Attention Mechanism)共有注意の機構

ToMM (Theory of Mind Mechanism)心の理論の機構

Page 56: 自然言語処理 2007

56

今日はこれまで.