[河原 達也教授 研究室] |
前提知識 | 2週目は Linux、Python、Pytorchなどの経験が必要 |
---|
9:30~ |
音声技術の展望 深層学習、ビッグデータ |
|
---|---|---|
11:00~ |
音声認識の概要 音声認識の原理、End-to-Endモデル |
|
12:30~ | 休 憩 | |
13:30~ |
音声認識の基盤技術 音声分析、音響モデル、HMM、言語モデル、N-gram |
|
15:00~ |
音声認識演習(Julius) 文法記述による音声認識システム構築 |
|
16:30~ 18:00 |
音声対話システム実装① 音声認識・音声合成 |
9:30~ |
音声対話の概要 音声対話システムの構成、タスクの分類 |
|
---|---|---|
11:00~ |
音声対話の基盤技術 音声言語理解、応答生成 |
|
12:30~ | 休 憩 | |
13:30~ |
音声対話システム実装② 言語理解 |
|
15:00~ |
音声対話システム実装③(対話管理) 対話管理 |
|
16:30~ 18:00 |
スマートスピーカアプリ実装(Dialogflow) スマートスピーカなどを想定したアプリ構築 |
9:30~ |
系列写像学習 Seq2seqモデル、End-to-End認識、CTC、注意機構モデル |
|
---|---|---|
11:00~ |
Seq2seqモデル学習演習 CTC、注意機構モデル、Acoustic-to-Wordモデル |
|
12:30~ | 休 憩 | |
13:30~ |
seq2seqモデル学習演習 (同上) |
|
15:00~ |
マイクアレイ信号処理の基礎 音の伝達過程、ステアリングベクトル、確率モデル |
|
16:30~ 18:00 |
ビーフォーミング DS、ML、MVDRビームフォーマ |
9:30~ |
音源定位 部分空間法、MUSIC法 |
|
---|---|---|
11:00~ |
音響モデリング MM/EMアルゴリズム、NMF、VAE |
|
12:30~ | 休 憩 | |
13:30~ |
ブラインド音源分離 IICA、IVA、ILRMA、MNMF、FastMNMF |
|
15:00~ |
ブラインド音源分離 (同上) |
|
16:30~ |
音楽分離 U-Net |
|
18:00~ | アフターセッション |