2016 Fiscal Year Annual Research Report
Project/Area Number |
16H02847
|
Research Institution | Kyoto University |
Principal Investigator |
河原 達也 京都大学, 情報学研究科, 教授 (00234104)
|
Co-Investigator(Kenkyū-buntansha) |
秋田 祐哉 京都大学, 経済学研究科, 講師 (90402742)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 音声認識 / コンテンツ・アーカイブ / 機械学習 / 字幕付与 |
Outline of Annual Research Achievements |
放送大学の講義と学会の講演を主な対象として、音声認識の半自律的な学習の枠組みを検討し、字幕付与システムを実装・公開・試験運用した。 (1) 音声認識、特に音響モデルの半自律的な学習の枠組みを検討した。まず、字幕テキストと複数の音声認識結果に基づいて、音声認識の音響モデルを学習するための教師ラベルを生成し、準教師付き学習(lightly-supervised training)を実現した。次に、既存の大規模な学習データベースと組み合わせる半教師付き学習(semi-supervised training)を実現した。また、ディープニューラルネットワークのマルチタスク学習などの方法も検討した。 (2) 音声認識に基づく字幕付与システム(http://caption.ist.i.kyoto-u.ac.jp/)を公開・試験運用した。放送大学の複数の講義を対象に、音声認識結果を修正・編集することにより、実際に字幕を作成してもらった。また、情報処理学会の複数の研究会などで、リアルタイム字幕付与の試験運用を実施した。 (3) 英語や中国語の講演コンテンツ(TEDやCCTVの「百家講壇」)を対象に字幕を付与し、これらの言語を学習する日本人のリスニング訓練に応用することを研究した。自動音声認識が困難な箇所と学習者のリスニングが困難な箇所との関係について分析し、これを用いた字幕提示法を提案した。 (4) 『聴覚障害者のための字幕付与技術』シンポジウムを開催し、聴覚障害者・要約筆記ボランティアに加えて、会議録を作成している速記者やテレビ字幕を作成している方と字幕付与の方法について情報交換・議論を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
論文発表に加えて、報道発表も行った。
|
Strategy for Future Research Activity |
引き続き、システムの試験運用と改善を行う。
|
Research Products
(9 results)