2017 Fiscal Year Annual Research Report
Studies of utilization of lecture speeches recorded in various environments for learning/educational support
Project/Area Number |
15K00254
|
Research Institution | Kyoto University |
Principal Investigator |
南條 浩輝 京都大学, 学術情報メディアセンター, 准教授 (50388162)
|
Co-Investigator(Kenkyū-buntansha) |
西崎 博光 山梨大学, 大学院総合研究部, 准教授 (40362082)
高橋 徹 大阪産業大学, デザイン工学部, 准教授 (30419494)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 音声言語情報処理 / 学習支援 / 教育支援 / 授業音声の利活用 |
Outline of Annual Research Achievements |
「録音環境が整えられている教室」に限らない、多様な録音環境を対象とした、汎用的な授業音声の再利用(教育・学習支援)の基盤形成をめざし研究を推進した。以下に内容をまとめる。 - 授業音声の分析・明瞭化: 授業音声の回復、または、音声言語処理を適用しやすい音声への変換技術について研究を進めた。既存の雑音残響抑圧技術の適用可能性と問題点を検討し、音声の回復では、信号の歪と量子化ビット数の両方が重要であることを確認した。複数話者が存在する授業音声を扱う際の知見として活用をするべく、複数名が同時発話する環境での自由発話の傾向を調査し、音響特徴を調べた。また、音声圧縮技術による明瞭化も検討した。H29年度はモノラル録音された授業音声の明瞭化のため、教師発話の分離手法を研究した。具体的には非負値行列分解法の拡張、すなわち音声スペクトルモデルに特化した基底ベクトルを獲得可能な方式への拡張をおこなった。 - 多様な環境の授業を指向した音声認識: はじめに小学校授業音声をそのまま認識し、次に音響モデル学習と多様な録音環境での収録音声の活用を視野に入れ、授業音声コーパスに様々な音声圧縮を適用し、それらの扱いについて研究を推進した。さらに、音声認識誤り訂正手法を研究をした。H29年度は、H28年度から引き続き、深層学習とデータ圧縮技術による擬似多様環境音声の作成とそれを用いた音声認識の研究を推進した。これは、音声認識システム構築において高コストである多様な環境での大量音声収集・整備の代用・補完技術と位置付けることができ、意義深い。また、授業で使える電子ノートシステムの開発とその効果を確認した。 - 授業音声の再利用のための基盤技術: 期間全体を通じて、アーカイブした授業データを効率よく検索するための技術(音声ドキュメント検索)の研究を推進し、検索性能の改善を得た。
|