Session2 音声メディア Session2 音声メディア [河原 達也教授 研究室]
2nd_pc_border_top.png
音声強調・認識・対話の理論的基盤の講義と最新動向の紹介および、アプリケーション作成からモデルの深層学習演習を行います。
 
河原 達也
京都大学大学院 情報学研究科 知能情報学専攻 教授
河原 達也
 
吉井 和佳
京都大学大学院 情報学研究科 知能情報学専攻 准教授
吉井 和佳
 
井上 昴治
京都大学大学院 情報学研究科 知能情報学専攻 助教
井上 昴治
音声強調・認識・対話の理論的基盤の講義と最新動向の紹介および、アプリケーション作成からモデルの深層学習演習を行います。



京都大学大学院 情報学研究科 知能情報学専攻 教授
河原 達也
河原 達也
 





京都大学大学院 情報学研究科 知能情報学専攻 准教授
吉井 和佳
吉井 和佳
 





京都大学大学院 情報学研究科 知能情報学専攻 助教
井上 昂治
井上 昂治
前提知識 2週目は Linux、Python、Pytorchなどの経験が必要
2nd_pc_border_bottom.png
9月16日(木)
9:30~ 講義 音声技術の展望
深層学習、ビッグデータ
11:00~ 講義 音声認識の概要
音声認識の原理、End-to-Endモデル
12:30~ 休 憩
13:30~ 講義 音声認識の基盤技術
音声分析、音響モデル、HMM、言語モデル、N-gram
15:00~ 演習 音声認識演習(Julius)
文法記述による音声認識システム構築
16:30~ 演習 音声対話システム実装①
音声認識・音声合成
 
9月17日(金)
9:30~ 講義 音声対話の概要
音声対話システムの構成、タスクの分類
11:00~ 講義 音声対話の基盤技術
音声言語理解、応答生成
12:30~ 休 憩
13:30~ 演習 音声対話システム実装②
言語理解
15:00~ 演習 音声対話システム実装③
対話管理
16:30~ 演習 スマートスピーカアプリ実装(Dialogflow)
スマートスピーカなどを想定したアプリ構築
 
9月30日(木)
9:30~ 講義 系列写像学習
Seq2seqモデル、End-to-End認識、CTC、注意機構モデル
11:00~ 演習 Seq2seqモデル学習演習
CTC、注意機構モデル、Acoustic-to-Wordモデル
12:30~ 休 憩
13:30~ 演習 seq2seqモデル学習演習
 
15:00~ 講義 多チャンネル信号処理の基礎
音の伝播過程、確率モデル
17:00~ 講義
演習
音源定位
部分空間法、MUSIC法
 
10月1日(金)
9:30~ 講義
演習
音源強調
ビームフォーミング、深層マスク推定
12:30~ 休 憩
13:30~ 講義
演習
統計的信号処理の基礎
NMF、VAE、MMアルゴリズム
15:30~ 講義
演習
音源分離
ICA、IVA、ILRMA、FastMNMF
18:00~ アフターセッション
 
講座について
要項・申込
 
お問い合わせ お問い合わせ
©Kyoto University Original Co., Ltd. All rights reserved. ©Kyoto University Original Co., Ltd. All rights reserved.  
TOP