自然言語処理 2007
Post on 08-Jan-2016
64 Views
Preview:
DESCRIPTION
Transcript
1
自然言語処理 2007
平成 20 年 1 月 7 日 ( 月)東京工科大学コンピュータサイエンス学部 亀田弘之
2
今までやってきたこと
3
今までやってきたこと
自然言語処理とは 自然言語処理(理解)過程の概要 形態素解析(各種手法とツール) 構文解析 言語獲得(文法獲得)
4
自然言語処理とは
自然言語 (Natural Languages) 言語
思考のための道具 情報・知識を記述・蓄積するための道具 コミュニケーションのための道具
言語=自然言語+人工言語 自然言語=文字言語+音声言語+視覚言語
処理=理解+生成 処理の主体(機械 or 人間)
本授業は主として「文字言語+理解」を取り扱う
5
自然言語処理(理解)過程の概要
形態素解析 (Morpheme analysis) 構文解析 (Syntactic analysis) 意味解析 (Semantic analysis) 談話解析 (Discourse analysis) 状況解析 (Situation analysis)
6
形態素解析の手法 文字種法 最長一致法 文節数最少法 接続表を利用する方法 遷移確率を用いる方法 コスト最小法 (Juman) 隠れマルコフモデル法 (Chasen) その他 (Kabocha 等は SVM を利用 )
SVM: Support Vector Machine(機械学習法の1つ )
7
形態素解析のツール
Juman Chasen (茶筌) Kobako/J その他いろいろあります
( Internet などで調べてみましょう.) 自作のソフトウェア
8
統語解析
言語・文法言語=文法的に適格な文の集合文法= <Vn, Vt, s, P>
Vn: 非終端記号の集合Vt: 非終端記号の集合s: 開始記号P : 書き換え規則群
(チョムスキーの文法理論に準拠)
9
統語解析 言語・文法
言語=文法的に適格な文の集合文法= <Vn, Vt, s, P>
Vn: 非終端記号の集合(構文構造記述用文法用語集)
Vt: 終端記号の集合(語彙)s: 開始記号P : 書き換え規則群
(チョムスキーの文法理論に準拠)
10
Tom broke the cup with the hammer.
11
言語獲得(文法獲得)
未知語獲得( Vt の拡張) 統語規則獲得 (Vn およびPの拡張 )
12
未知語獲得
定義 分類
13
未知語の定義
人間にとっての未知語:初見の単語?(定義困難?)
機械にとっての未知語:システム辞書に登録されていない単語(未登録語)
14
未知語の分類(概要)
第1種の未知語(異表記未知語) 第2種の未知語(未知複合語) 第3種の未知語(その他)
15
第1種(異表記未知語)1. 東京大学付属病院 東京大學附属病院2. 組合せ 組み合せ 組み合わせ 組み合わ
せ3. 飛び込む 飛びこむ4. コンピュータ コンピューター etc.
16
第 2 種(未知複合語)
1. 数学辞典2. 見学旅行3. 個人旅行4. 月旅行5. 温泉旅行6. 積み立て旅行 etc.
これらの単語を辞書で調べてみよう.このうちの幾つかは通常の辞書には載っていない.そのような語は他にもあり得る.どうすればいいのだろうか?
17
第3種
その他 のだめ rlgg モー娘
18
未知語処理
要素プロセス 処理モード 処理方略
19
未知語処理の要素プロセス
1. 未知語存在の検出2. 未知語候補の切り出し3. 内部構造の解析4. 品詞推定5. 意味推定6. 意味整合性の確認7. 辞書処理(追加・削除・更新 など)
20
未知語処理の処理モード
処理モード 未知語 未知統語規則
モード1 無 無
モード2 有 無
モード 3 無 有
モード 4 有 有
21
今日の内容
より深い自然言語処理 他者理解
感情・意図理解(・社会認知?) 心のモデル(・認知機能モデル?)
22
心のモデルとそれに基づく感情・意図推測方法
2006 年 10 月 20 日
東京工科大学亀田弘之・小澤朋之・難波創
電子情報通信学会思考と言語研究会平成 19年 10月 20日発表資料
於 NHK基礎研究所
23
はじめに( 1/5 )
いじめ 引きこもり心の問題
社会の高度化・複雑化
「癒し」を切実に求めている
24
はじめに( 2/5 )
癒し心理的効果
人を元気づけることや動機づける
生理的効果ストレスを低減し血圧や脈拍を正常にさせる
現代社会に必要とされている
25
はじめに( 3/5 )
PaPeRo ifbot
人との共存を目的として開発されているロボット
人に安らぎや癒しを与えることができる
26
はじめに( 4/5 )
ふれあい癒される~
円滑で自然な意思疎通が必要不可欠
27
コミュニケーションによる癒しの実現人とふれあう癒し系ロボット PDDIN
PDDIN ですよろしく~♪
はじめに( 5/5 )
28
従来の心・感情モデル( 1/5 )
“人の心”という概念を扱う場合に,まさにその心自体を記述・表現するためのものである
心のモデル
心のモデルに関するさまざまな提案がされている
29
従来の心・感情モデル( 2/5 )
図 1 :心の計算機モデル(岡田直之)
30
従来の心・感情モデル( 3/5 )
図 2 :意識の外にある無意識の自律分散計算結果にボトムアップに注意を払う受動的な意識を仮定する心のモ
デル(前野隆司)
31
従来の心・感情モデル( 4/5 )
図 3 :感情の立体モデル( P.Plutchik )
32
The Theory of Mind (心の理論)
Premack & Wooddruff(1978) Baron-Cohen(1995)
33
心の理論とは
34
The Theory of Mind
ID (Intentionality Detector)意図検出器
EDD (Eye-Direction Detector)視線方向検出器
SAM (Shared Attention Mechanism)共有注意の機構
ToMM (Theory of Mind Mechanism)心の理論の機構
35
従来の心・感情モデル( 5/5 )
1.処理のためのデータ構造やアルゴリズムが明確に示してはいない
2.工学的に応用するまでに至っていない
従来のモデルの問題点
人とふれあう癒し系ロボット PDDINの研究・開発による心のモデルの考案
36
PDDIN
2002 年度から開発されている
1.感情モデルの提案2.感情モデルをもちいた,感情システムの構築
研究内容
4.ロボット本体の作製
3.対話処理システムの構築
37
PDDIN2005 デモムービー
38
考察
モデルの意義の一つは「システムの設計図」である。
従来の心・感情のモデルは設計図としては不十分。
というのも…
39
ソフトウェア工学の分野では、「大規模化・複雑化した情報システム」に対して、様々な観点から分析・記述・設計
人間の心(脳)も同様ではないのか?
40
ソフトウェア工学で使用する図(UML)
1. ユースケース図2. クラス図3. オブジェクト図4. シーケンス図5. ステートマシン図(ステートチャート図)
6. アクティビティ図7. コンポーネント図
8. コミュニケーション図(コラボレーション図)
9. 配置図10. コンポジット図11. タイミング図12. 相互作用概念図
こんなにたくさんある!
41
UML での各種ビュー
ユースケース図 アクティビティ図シーケンス図
コミュニケーション図(コラボレーション図)
ステートマシン図(ステートチャート)
クラス図オブジェクト
図
コンポーネント図
配置図
ユースケースビュー
論理ビュー
配置ビュー
並行性ビュー
コンポーネントビュー
こんなにたくさんの視点がある!
42
人間の心(脳)に対しても、 UML を参考にしてモデルを記述するべきであろう。
(今後の方針)
43
心のモデル
計算論的なモデルが必要(今回の基本的主張)
44
記憶のモデル(従来のモデルの例)
銘記 保持 想起
感覚貯蔵庫 短期記憶 長期記憶
45
心のモデル
データ構造+アルゴリズム
知識表現+プログラム(オブジェクト指向)
46
心のモデルの概要図
47
心のモデルの知識表現
48
心のモデルのプログラム
49
心のモデルのプログラム
理解と生成 生成はシステム設計者依存 理解は相手がある->この解決方法は?
50
心のモデルのプログラム
理解と生成 生成:生成関数 F を利用 理解:生成関数 F の逆関数で推定
逆関数の存在は? 逆関数の同定(作成)方法は? 逆関数の計算は?
解決すべき問題はたくさんある!どうすればいいのか!?
51
刺激 A
反応 B
52
D:心の状態A:発話+仕草F: D → A
D:心の状態A:発話+仕草F: D → A
同一視
図6.心のモデルの共通仮説
心のメカニズムは共通
53
生成関数 F の定義
刺激 X 心の状態 Y 反応
F(X,Y)
α A F1
α B F2
β A F3
β B F4
γ A F5
γ B F6
54
まとめ 癒しを実現するためには心のモデルが重
要(他者理解なくしては癒しなし!)
計算論的心のモデルが必要 計算論的とは、
知識表現+プログラム 心のモデルの提案
知識表現+プログラム 他者理解の方法
( IbS: Inference by Synthesis )
55
The Theory of Mind
ID (Intentionality Detector)意図検出器
EDD (Eye-Direction Detector)視線方向検出器
SAM (Shared Attention Mechanism)共有注意の機構
ToMM (Theory of Mind Mechanism)心の理論の機構
56
今日はこれまで.
top related