• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2010 年度 実績報告書

音声認識による話題語の継時的提示に関する研究

研究課題

研究課題/領域番号 22500151
研究機関岐阜大学

研究代表者

速水 悟  岐阜大学, 工学部, 教授 (90345794)

研究分担者 田村 哲嗣  岐阜大学, 工学部, 教授 (10402215)
キーワード音声情報処理
研究概要

平成22年度は,話題語の継時的提示のために,話題の変化と提示するキーワード選定の問題を同時に解決する手法として,複数のLDA(Latent Dirichlet Allocation)を統合する手法を提案し,連続的なメディアコンテントに適用した。
LDAは文中の単語の生起確率が潜在的なトピックに依存するトピック言語モデルの一つであり,そのトピックの事前確率がディリクレ分布に従うことを仮定した生成型の確率言語モデルである。これまで複数LDAの統合手法を,単語の予測入力に適用してきた。これは単語列の履歴から,つぎに接続する単語候補を,高精度・ロバストに予測する手法である。本研究では,トピック数の異なる複数のLDAを統合して,話題境界の検出とキーワードの選定に利用している。
提示方法としては,キーワードにトピックごとに異なる文字色を付与し,話題の変化を示す方法を提案した。また具体的な提示システムとして,音声と動画を含む映像コンテントに対して,キーワードの文字色を変化させた字幕を付与するシステムを開発した。この提示システムを用いて,被験者に,字幕を付与した映像コンテントを提示し,その有効性を評価する心理学的な実験を行い,その有効性を示した。さらに,フィラー(つなぎ語)の除去や,条件付き確率場を利用した文境界の検出手法について検討した。今後は,トピック言語モデルを用いたテキスト処理と音声認識処理を統合することと,音声認識精度をさらに向上させる必要がある。
これらの成果は,国際会議(2件)と国内研究会(1件)において,発表した。映像コンテントの理解を支援するための新しい手法を提案した点が,とくに重要である。

  • 研究成果

    (3件)

すべて 2011 2010

すべて 学会発表 (3件)

  • [学会発表] 複数トピックモデルを用いたキーワード抽出2011

    • 著者名/発表者名
      長谷川, 岡本, 中村, 祖父江, 田村, 速水
    • 学会等名
      第5回音声ドキュメント処理ワークショップ
    • 発表場所
      豊橋科学技術大学
    • 年月日
      2011-03-07
  • [学会発表] Topic-based generation of keywords and caption for video content2010

    • 著者名/発表者名
      Okamoto, Hasegawa, Sobue, Nakamura, Tamura, Hayamizu
    • 学会等名
      国際会議APSIPA ASC 2010
    • 発表場所
      Biopolis, Singapore
    • 年月日
      2010-12-16
  • [学会発表] Cases on extension of language technology into the related fields and their implications for research and development in university2010

    • 著者名/発表者名
      Hayamizu, Matsumoto, Tamura, Takeuchi
    • 学会等名
      国際会議Oriental Cocosda 2010
    • 発表場所
      Kathmandu, Nepal
    • 年月日
      2010-11-25

URL: 

公開日: 2012-07-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi