2012 Fiscal Year Annual Research Report
Project/Area Number |
22500151
|
Research Institution | Gifu University |
Principal Investigator |
速水 悟 岐阜大学, 工学部, 教授 (90345794)
|
Co-Investigator(Kenkyū-buntansha) |
田村 哲嗣 岐阜大学, 工学部, 助教 (10402215)
|
Project Period (FY) |
2010-04-01 – 2013-03-31
|
Keywords | 音声情報処理 |
Research Abstract |
音声認識による映像メディアへの自動字幕付与は,聴覚障碍者や高齢者への支援となる.本研究は,映像メディアの音声認識結果に対して,発話内容を短時間に把握できるような情報を抽出し,字幕とともに提示する技術の開発を目的とした.音声認識結果から,時間とともにゆるやかに変化する話題や内容を表すキーワード群を抽出する手法を提案することと,キーワード群を字幕に併せて提示する方法の有効性を実験的に明らかにすることを特色とする. 話題の変化を表すキーワード群による要約提示用のテキスト生成手法と,音声認識結果からの話題語抽出手法と,認知心理学的な評価実験による有効性の評価の3項目に重点を置いた.また経済とスポーツのような大きな話題の変化ではなく,全体の中で話題や内容が小さく連続的に変化するようなコンテントへの適用をねらいとした.コンテント内の話題推移の推定とキーワード群抽出の実験においては,領域の違いや話題展開形式が異なる新聞記事,講演,ニュース解説を対象とした.評価実験においては,映像に字幕とキーワード群を付与した閲覧システムを作成し,被験者実験を行った.キーワード群の抽出においては,複数のトピック言語モデルの結果を統合する方法を新たに提案した.また音声認識誤りの影響についてはWeb文書の利用の有無などの異なる実験条件でキーワード群を抽出して比較を行った. 話題の変化とそれを表すキーワード群の抽出手法として,統計的な言語モデルを利用する手法を提案した.また音声認識誤りへの対策として,平均相互情報量の推定にWeb 文書を利用する手法を提案した.さらに映像に対して字幕とキーワード群を付与し,その話題の変化を提示するシステムを作成した.被験者実験によって,提案した手法の有効性を明らかにした.
|
Current Status of Research Progress |
Reason
24年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
24年度が最終年度であるため、記入しない。
|
Research Products
(2 results)