2010 Fiscal Year Annual Research Report
Project/Area Number |
22500151
|
Research Institution | Gifu University |
Principal Investigator |
速水 悟 岐阜大学, 工学部, 教授 (90345794)
|
Co-Investigator(Kenkyū-buntansha) |
田村 哲嗣 岐阜大学, 工学部, 教授 (10402215)
|
Keywords | 音声情報処理 |
Research Abstract |
平成22年度は,話題語の継時的提示のために,話題の変化と提示するキーワード選定の問題を同時に解決する手法として,複数のLDA(Latent Dirichlet Allocation)を統合する手法を提案し,連続的なメディアコンテントに適用した。 LDAは文中の単語の生起確率が潜在的なトピックに依存するトピック言語モデルの一つであり,そのトピックの事前確率がディリクレ分布に従うことを仮定した生成型の確率言語モデルである。これまで複数LDAの統合手法を,単語の予測入力に適用してきた。これは単語列の履歴から,つぎに接続する単語候補を,高精度・ロバストに予測する手法である。本研究では,トピック数の異なる複数のLDAを統合して,話題境界の検出とキーワードの選定に利用している。 提示方法としては,キーワードにトピックごとに異なる文字色を付与し,話題の変化を示す方法を提案した。また具体的な提示システムとして,音声と動画を含む映像コンテントに対して,キーワードの文字色を変化させた字幕を付与するシステムを開発した。この提示システムを用いて,被験者に,字幕を付与した映像コンテントを提示し,その有効性を評価する心理学的な実験を行い,その有効性を示した。さらに,フィラー(つなぎ語)の除去や,条件付き確率場を利用した文境界の検出手法について検討した。今後は,トピック言語モデルを用いたテキスト処理と音声認識処理を統合することと,音声認識精度をさらに向上させる必要がある。 これらの成果は,国際会議(2件)と国内研究会(1件)において,発表した。映像コンテントの理解を支援するための新しい手法を提案した点が,とくに重要である。
|
Research Products
(3 results)