研究課題/領域番号 |
23700115
|
研究機関 | 豊橋技術科学大学 |
研究代表者 |
土屋 雅稔 豊橋技術科学大学, 情報メディア基盤センター, 助教 (70378256)
|
キーワード | 音声認識 / 固有表現 |
研究概要 |
講義音声には,多くの話し言葉的現象(フィラー,ポーズ,言い淀み,言い直しなど)が含まれる.H24年度は,それらの話し言葉的現象に対して頑健な自動音声認識を実現するための研究を行った.言い淀み・言い直しについては,言い淀み・言い直しに対応した言語モデルを構築するために,言い淀み・言い直し情報が整形されて失われている国会会議録テキストと元の音声情報とを対応付ける方法について検討した.提案手法は,音響的素性に基づく会議録テキストと音声情報の強制アラインメントと,強制アラインメントによって得られた素性に基づいて整形個所を検出する識別器からなる(国際会議発表1件).また,講義音声には,講義内容に特有の固有的な事物を表すための固有表現が頻出する.これらを再現率良く検出するための方法について検討した(全国大会発表1件).
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
H24年度は,講義音声を対象とする自動音声認識,講義音声に含まれる固有表現の抽出については順調に進捗した. ただし,H24年度までの検討により,講義音声を対象とする自動音声認識は,依然としてかなり難しいタスクであることもはっきりとした. そのため,講義音声とスライド要素との自動対応付けについても,予想よりも難しいタスクであることが分かってきた.
|
今後の研究の推進方策 |
H24年度に引き続き,高精度な講義音声認識と固有表現抽出および機能表現抽出に取り組む.また,スライド要素および要約の正解データを作成し,それらのデータを用いた評価を進める.
|
次年度の研究費の使用計画 |
H24年度までの検討により,講義音声を対象とする自動音声認識は,依然としてかなり難しいタスクであることがはっきりとした.そのため,講義音声とスライド要素との自動対応付けについても,予想よりも難しいタスクであることが分かってきた.そのため,スライド要素および要約の正解データを作成予定が遅れている. H25年度については,スライド要素および要約の正解データ作成などの作業と,それらのデータを用いた評価を進める予定である.
|