2011 Fiscal Year Research-status Report
スライドと音声を組み合わせた講義コンテンツの構造化と要約に関する研究
Project/Area Number |
23700115
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
土屋 雅稔 豊橋技術科学大学, 情報メディア基盤センター, 助教 (70378256)
|
Project Period (FY) |
2011-04-28 – 2014-03-31
|
Keywords | 音声認識 / 機能表現 |
Research Abstract |
講義音声には,多くの話し言葉的現象(フィラー,ポーズ,言い淀み,言い直しなど)が含まれる.H23年度は,それらの話し言葉的現象に対して頑健な自動音声認識を実現するための研究を行った.自発的に発声される話し言葉音声には,言語的な区切りとは無関係な位置に多数のポーズが出現するため,コーパス中の句読点をポーズとみなして言語モデルを学習しても,ポーズのモデル化は不十分になってしまう.そのため,日本語話し言葉コーパスに収録された音声情報からポーズ出現一に関するモデル(ポーズ挿入モデル)を学習し,ポーズ情報を含まないコーパス(国会会議録)を組み合わせることによって,ポーズに対応した言語モデルを構築する方法を提案し,その有効性を示した(雑誌論文1件).言い淀み・言い直しについては,言い淀み・言い直しに対応した言語モデルを構築するために,言い淀み・言い直し情報が整形されて失われている国会会議録テキストと元の音声情報とを対応付ける方法について検討した.提案手法は,音響的素性に基づく会議録テキストと音声情報の強制アラインメントと,強制アラインメントによって得られた素性に基づいて整形個所を検出する識別器からなる(国際会議発表1件,研究会報告1件).また,日本語には,複数の語がひとかたまりの表現として非構成的な意味を持ち,機能的関係を表すようになった機能表現が多数存在する.含意関係抽出を行うには,意味的に類似している内容語だけでなく,意味的に類似している機能語と機能表現(例えば,「について」と「に関して」)の差異を吸収する必要がある.その前段階として,多種多様な機能表現の用法を判定する方法について検討した(全国大会発表1件).
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
H23年度は,講義音声を対象とする自動音声認識,書き言葉を対象とする機能表現の用法判定については順調に進捗した.ただし,H23年度の検討により,講義音声を対象とする自動音声認識は,依然としてかなり難しいタスクであることもはっきりとした.そのため,講義音声とスライド要素との自動対応付けについても,予想よりも難しいタスクであることが分かってきた.
|
Strategy for Future Research Activity |
H23年度に引き続き,高精度な講義音声認識と機能表現抽出に取り組む.また,スライド要素および要約の正解データを作成し,それらのデータを用いた評価を進める.
|
Expenditure Plans for the Next FY Research Funding |
H23年度の検討により,講義音声を対象とする自動音声認識は,依然としてかなり難しいタスクであることもはっきりとした.そのため,講義音声とスライド要素との自動対応付けについても,予想よりも難しいタスクであることが分かってきた.そのため,スライド要素および要約の正解データを作成予定が遅れている.そのため,データ作成に関わる謝金について次年度使用が発生した.H24年度については,スライド要素および要約の正解データ作成などの作業と,それらのデータを用いた評価を進める予定である.
|
Research Products
(5 results)