研究課題/領域番号 |
23700115
|
研究種目 |
若手研究(B)
|
配分区分 | 基金 |
研究分野 |
メディア情報学・データベース
|
研究機関 | 豊橋技術科学大学 |
研究代表者 |
土屋 雅稔 豊橋技術科学大学, 情報メディア基盤センター, 准教授 (70378256)
|
研究期間 (年度) |
2011-04-28 – 2015-03-31
|
研究課題ステータス |
完了 (2014年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2013年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2012年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2011年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
|
キーワード | 自動要約 / 音声認識 / 固有表現 / 機能表現 |
研究成果の概要 |
講義音声には,多くの話し言葉的現象(フィラー,ポーズなど)が含まれる.講義音声を要約するには,それらの話し言葉的現象に対して頑健な自動音声認識を実現する必要がある.日本語話し言葉コーパスに収録された音声情報からポーズ出現位置に関するモデル(ポーズ挿入モデル)を学習し,ポーズ情報を含まないコーパス(国会会議録)を組み合わせることによって,ポーズに対応した言語モデルを構築する方法を提案し,その有効性を示した. また,講義音声に頻出する講義内容に特有の固有的な事物を,検出漏れをできるだけ少なく検出する方法について検討した.講義スライドと講義音声書き起こしとの人手対応付けの作業手順の作成を行った.
|