Top Banner
9:30 12:30 13:30 16:30 11:00 15:00 18:00 音声技術の展望 深層学習、ビッグデータ 音声認識の概要 音声認識の原理、 End-to-Endモデル 音声認識の 基盤技術 音声分析、音響モデル、HMM、 言語モデル、N-gram 音声認識演習 (Julius) 文法記述による 音声認識システム構築 音声対話の概要 音声対話システムの構成 タスクの分類 音声対話の 基盤技術 音声言語理解、応答生成 音声対話演習 (MMDAgent) MMDAgentを用いた 音声対話エージェントの構築 音声対話演習 (Dialogflow) Dialogflowを用いた 音声対話システムの構築 音声対話演習 アプリ作成 スマートスピーカなどを 想定したアプリ構築 系列写像学習 実習環境の準備 CTC seq2seqモデル学習演習 (Speech Commands) 注意機構モデル NMF、VAE 音声強調・分離演習 DNNによるマスク推定 Acoustic-to-Wordモデル 音声強調 雑音・残響抑圧 マイクロフォンアレイ 音声分離 NMF、VAE、 ディープクラスタリング 統計的言語モデルによる 音声認識構築 Session 1 コンピュータ ビジョン 西野恒 研究室 9:30 12:30 13:30 16:30 11:00 15:00 18:00 コンピュータ ビジョン動向 特に人の意図理解を中心と した最先端の研究の俯瞰 画像特徴量 畳み込みフィルタ、 微分フィルタ、SIFT、HoG 識別器 顔認識 実画像処理、多クラス分類 画像特徴量 HoGの解析と可視化 MLP と学習 多層パーセプトロン、最適化、 交差検定、過学習 ConvNet 物体認識 VGG ImageNet 深層物体認識 畳み込みニューラルネット ワークを用いた物体認識 デジタルサイネージ・行動認識 インタラクティブなアプリケーション 動作認識 姿勢・物体認識を用いた動作認識の実装 ジェスチャー認識 姿勢を用いた ジェスチャー認識 ファインチューニング 学習済みモデルの活用 2 次元姿勢 特徴点検出、人体の部位検出、 二部グラフマッチング 3 次元幾何 カメラ・プロジェクティブ幾何 3 次元姿勢 マルチビュー幾何、 自己教師学習 Session 2 音声 メディア 河原達也 研究室 9 月24日(木) 9 月25日(金) 10月 1 日(木) 10月 2 日(金) 10月15日(木) 10月16日(金) 10月22日(木) 10月23日(金) 9:30 12:30 13:30 16:30 11:00 15:00 18:00 自然言語処理入門 I 自然言語処理の歴史の俯瞰、 形態素・構文解析の基礎 自然言語処理における ニューラルネット ニューラルネット入門 自然言語処理入門 II 自然言語解析ツール I 自然言語処理入門 III Seq2seq モデル BERT 導入・準備 英語 BERT Session 3 自然 言語処理 黒橋禎夫 研究室 10月29日(木) 10月30日(金) 11月 5 日(木) 11月 6 日(金) 最近傍探索、線形分類器、 マージン最大化、 サポートベクトルマシン 物体認識研究の俯瞰 学習済み深層学習モデル、 ImageNetを用いた交差検定 Seq2seqモデル、End-to-End認識、 CTC、注意機構モデル 『人を知る』人工知能講座 2020 人を知るための人を知ることによってできる人工知能~ カリキュラムは予定です。予告なく変更になる場合がありますので、予めご了承ください。 = 講義 = 演習 カリキュラム 畳み込みニューラルネットワーク、 確率的勾配法、損失関数、 バックプロパゲーション ニューラルネット実装 リカレント ニューラルネット リカレントニューラル ネットの実装 翻訳、要約、 対話モデル 総合課題 Wrap up & Discussion BERT最近の話題 深層学習フレームワーク PyTorchによる実装 RNN、 LSTM PyTorchによるLSTM実装 構文・格・文脈解析、情報 検索と質問応答の基礎 テキストの抽出、 クリーニング 構文解析システム BERTKNP Transformer、attention、 BERTの基礎 英語BERTモデルの利用、 fine-tuning 日本語BERTモデルの pre-training 日本語BERTモデルの利用、 fine-tuning BERTの発展的モデル、 最新の研究動向 形態素解析システム Juman++ イベント抽出システム EventGraph、情報分析・集約 機械翻訳、 対話システムの基礎 Seq2seqモデルに基づく 機械翻訳の実装 Seq2seqモデルの機械翻訳、 要約、対話への適用 日本語BERT 自然言語解析ツール II オンライン
2

PDF書き出し用カリキュラム A4 2020 のコピー · 物体認識研究の俯瞰 学習済み深層学習モデル、 ImageNetを用いた交差検定 Seq2seqモデル、End-to-End認識、

Jul 07, 2020

Download

Documents

dariahiddleston
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: PDF書き出し用カリキュラム A4 2020 のコピー · 物体認識研究の俯瞰 学習済み深層学習モデル、 ImageNetを用いた交差検定 Seq2seqモデル、End-to-End認識、

9:30 12:30 13:30 16:3011:00 15:00 18:00

音声技術の展望

深層学習、ビッグデータ

音声認識の概要

音声認識の原理、End-to-Endモデル

音声認識の基盤技術

音声分析、音響モデル、HMM、言語モデル、N-gram

音声認識演習 (Julius)

文法記述による音声認識システム構築

音声対話の概要

音声対話システムの構成タスクの分類

音声対話の基盤技術

音声言語理解、応答生成

音声対話演習 (MMDAgent)MMDAgentを用いた

音声対話エージェントの構築

音声対話演習(Dialogflow)Dialogflowを用いた音声対話システムの構築

音声対話演習アプリ作成

スマートスピーカなどを想定したアプリ構築

系列写像学習 実習環境の準備

CTC

seq2seqモデル学習演習(Speech Commands)

注意機構モデル

NMF、VAE

音声強調・分離演習

DNNによるマスク推定

Acoustic-to-Wordモデル

音声強調

雑音・残響抑圧マイクロフォンアレイ

音声分離

NMF、VAE、ディープクラスタリング

統計的言語モデルによる音声認識構築

Session

1コンピュータビジョン西野恒研究室

知能メディア

9:30 12:30 13:30 16:3011:00 15:00 18:00

コンピュータビジョン動向

特に人の意図理解を中心とした最先端の研究の俯瞰

画像特徴量

畳み込みフィルタ、微分フィルタ、SIFT、HoG

識別器 顔認識

実画像処理、多クラス分類

画像特徴量

HoGの解析と可視化

MLPと学習

多層パーセプトロン、最適化、交差検定、過学習

ConvNet 物体認識 VGGImageNet 深層物体認識

畳み込みニューラルネットワークを用いた物体認識

デジタルサイネージ・行動認識

インタラクティブなアプリケーション

動作認識

姿勢・物体認識を用いた動作認識の実装

ジェスチャー認識

姿勢を用いたジェスチャー認識

ファインチューニング

学習済みモデルの活用

2 次元姿勢

特徴点検出、人体の部位検出、二部グラフマッチング

3 次元幾何

カメラ・プロジェクティブ幾何

3 次元姿勢

マルチビュー幾何、自己教師学習

Session

2音声メディア河原達也研究室

9 月24日(木)

9 月25日(金)

10月 1 日(木)

10月 2 日(金)

10月15日(木)

10月16日(金)

10月22日(木)

10月23日(金)

9:30 12:30 13:30 16:3011:00 15:00 18:00

自然言語処理入門 I

自然言語処理の歴史の俯瞰、形態素・構文解析の基礎

自然言語処理におけるニューラルネット

ニューラルネット入門

自然言語処理入門 II 自然言語解析ツール I

自然言語処理入門 III Seq2seqモデル

BERT 導入・準備 英語 BERT

Session

3自然

言語処理黒橋禎夫研究室

10月29日(木)

10月30日(金)

11月 5 日(木)

11月 6 日(金)

最近傍探索、線形分類器、マージン最大化、

サポートベクトルマシン

物体認識研究の俯瞰 学習済み深層学習モデル、ImageNetを用いた交差検定

Seq2seqモデル、End-to-End認識、CTC、注意機構モデル

『人を知る』人工知能講座2020

~「人を知るための」・「人を知ることによってできる」人工知能~

カリキュラムは予定です。予告なく変更になる場合がありますので、予めご了承ください。

= 講義 = 演習

カリキュラム

畳み込みニューラルネットワーク、確率的勾配法、損失関数、バックプロパゲーション

ニューラルネット実装 リカレントニューラルネット

リカレントニューラルネットの実装

翻訳、要約、対話モデル 総合課題 Wrap up &

Discussion

BERT最近の話題

深層学習フレームワークPyTorchによる実装

RNN、LSTM PyTorchによるLSTM実装

構文・格・文脈解析、情報検索と質問応答の基礎

テキストの抽出、クリーニング

構文解析システムBERTKNP

Transformer、attention、BERTの基礎

英語BERTモデルの利用、fine-tuning

日本語BERTモデルのpre-training

日本語BERTモデルの利用、fine-tuning

BERTの発展的モデル、最新の研究動向

形態素解析システムJuman++

イベント抽出システムEventGraph、情報分析・集約

機械翻訳、対話システムの基礎

Seq2seqモデルに基づく機械翻訳の実装

Seq2seqモデルの機械翻訳、要約、対話への適用

日本語BERT

自然言語解析ツール II

オンライン

Page 2: PDF書き出し用カリキュラム A4 2020 のコピー · 物体認識研究の俯瞰 学習済み深層学習モデル、 ImageNetを用いた交差検定 Seq2seqモデル、End-to-End認識、

認知システム

脳認知科学

9:30 12:30 13:30 16:0011:00 15:00 18:00

12月10日(木)

12月11日(金)

12月24日(木)

12月25日(金)

頻出パターンマイニング

飽和アイテム集合マイニング

知識発見は人工知能か?機械学習は人工知能か?

NISOLシステムの紹介と準備

文字列間の距離と知識発見

CNF変換、SAT定式化方法

充足可能性問題(SAT) の基礎SATの歴史、基礎、ブール代数

SATソルバと定式化 SATを用いた問題解決

Python + Minisatを用いた組合せ最適化問題やパズルを解くためのアルゴリズムを実装する

MIPを用いた問題解決

Python + MIPソルバを用いた組合せ最適化問題やパズルを解くためのアルゴリズムを実装する

混合整数計画法(MIP) の基礎線形/整数計画法

MIPソルバと定式化

線形/整数計画法定式化入門

Session

4統計的機械学習鹿島久嗣研究室

Session

5離散構造データからの機械学習 山本章博研究室

11月19日(木)

11月20日(金)

11月26日(木)

11月27日(金)

Session

6認知情報学西田眞也研究室

9:30 12:30 13:30 16:0011:00 15:00 18:00

機械学習概説 回帰

機械学習の方法論 分類

推薦システム 推薦システム

グラフニューラルネットワーク

グラフニューラルネットワーク

イントロダクション:人間の認識・AI の認識

人間の感覚情報処理(1)

人間の視覚系の情報処理の基本的なしくみの解説

人をだますAIをだます 実習

人間と機械の視覚認識の特徴を実習形式で理解する

人間の感覚情報処理(2)

人間の視覚系の情報処理の基本的なしくみの解説(2)

リアリティとはなにか

人間がリアリティを感じるための条件を考える

人間の認識特性の技術応用

人間の情報処理を理解すると新しい

メディア技術も生まれる

マルチモーダル情報処理 質感の認識

質感(事物や事象の性質)の認識の原理を理解する

9:30 12:30 13:30 16:3011:00 15:00 18:00

2 月18日(木)

2 月19日(金)視覚以外の感覚モダリティの情報処理や複数感覚

モダリティの情報統合について理解する

Session

7心理情報学熊田孝恒研究室

イントロダクション:AIと人間

グループディスカッション

人間の計測:特性と状態の推定

人間の知能の特徴とAIの可能性

人間の知能の特性との比較からAIの可能性を

考える。

他者の意図・感情の理解とロボット技術他者の意図や感情の理解の

メカニズムとそのロボット技術への応用

個性とは何か:AIに個性を持たせることは可能か

人間の脳機能や認知機能の個人差から、人と人工知能の

関わりを考える

人間の意思決定や行動選択とAI

人間の意思決定、判断、行動選択のメカニズムから自動運転やAIによる

医療支援について考える。

AI 研究のための心理データ収集の基礎と応用

クラウドソーシング実習

実際のクラウドソーシングのタスク設計を体験する

9:30 12:30 13:30 16:3011:00 15:00 18:00

3 月 4 日(木)

3 月 5 日(金)心理データ収集の基礎測定の信頼性と妥当性、クラウドソーシングによるデータ収集のノウハウ

Session

8脳

情報学神谷之康研究室

脳科学の基礎と計算理論

脳・神経の解剖学・生理学の基礎、脳情報処理の数理モデリングの概説

脳の情報表現

神経コーディング・デコーディング

脳計測法

電気生理学、fMRI、EEG、ECoG、イメージング

DNNと脳

9:30 12:30 13:30 16:3011:00 15:00 18:00

3 月18日(木)

3 月19日(金)深層学習、畳み込みニューラルネットワーク、脳の階層的情報表現、DNNと脳の階層的相同性

最適化、最尤推定、モデル選択

機械学習の考え方、応用 回帰問題、線形回帰、最小二乗法、リッジ回帰

この講座の狙い。人間とAIの関係を感覚認識機能という

観点から考える

認識の間違いのパタンから人間とAIの視覚認識の関係を理解する

全体のまとめとグループディスカッション

この講座の狙い。人間とAIの関係を考える。人間の心の理解を基盤とする。

人間の注意や意識のメカニズムから人間とAIとのコミュニケーションを考える。

注意・不注意・意識のメカニズムと自動運転・インタフェース

Aiと人間の基本的な違いは何か。人間のどのような部分をAIで代替や

支援できるか、すべきか。

人間を計測することについての基礎知識の応用について。

脳の数理モデル

脳内イメージの可視化

DNN画像特徴の可視化、深層イメージ再構成

単一ニューロンモデル、ネットワークモデル、エンコーディング・デコーディングモデル

非線形回帰 非線形回帰回帰

ニューラルネットワーク

ニューラルネットワーク 発展的話題

転移学習他

発展的話題

強化学習、AIの説明可能性、因果推論、集合知

異常検知

教師なし異常検知、時系列異常検知

特徴選択と次元削減 特徴選択と次元削減 グラフ学習

グラフマイニング、グラフカーネル、ラベル伝播

フィッシャー判別、ロジスティック回帰、ナイーブベイズ分類

行列分解、因子分解マシン、テンソル分解

グラフ畳み込みニューラルネットワーク

非線形回帰モデル、カーネル法、アンサンブルモデル

深層学習、計算グラフ、自動微分

飽和アイテム集合マイニング

編集距離、動的計画法、LCS Thaiマッピング、ボトムアップ距離、トップダウン距離

頻出パターンマイニングと情報幾何

文字列・木構造データ間の距離と知識発見

木構造データ間の距離と知識発見

離散データ間の距離と数学

基礎論・代数学

Lasso、主成分分析、オートエンコーダ