• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2009 年度 実績報告書

複数認識器の統合による音声及び画像の協調理解とマルチモーダル対話システムへの応用

研究課題

研究課題/領域番号 21500143
研究機関九州工業大学

研究代表者

遠藤 勉  九州工業大学, 大学院・情報工学研究院, 教授 (10112294)

研究分担者 嶋田 和孝  九州工業大学, 大学院・情報工学研究院, 助教 (50346863)
キーワードマルチモーダルインターフェース / 音声理解 / ジェスチャ認識 / 情報統合 / 複数認識器
研究概要

対面コミュニケーション状況で観測されるマルチモダリティを複数の認識モジュールで入力・解析し,タスクの特性に応じて適宜,結果の統合を行いながら,言語情報と画像情報を協調理解する方式を開発するとともに,マルチモーダル対話システムに応用して有効性を検証するために,平成21年度は,(1)コーパス整備ツールの作成と評価,(2)複数の情報源もしくは認識器を用いたデータ解析と入力モダリティ認識アルゴリズムの開発,(3)音声とジェスチャを統合したアプリケーションの試作を行った。(1)のコーパス作成ツールでは,複数のアノテータ間でタグの一致度が向上するように,それぞれの履歴と過去の自分のタグ付けの傾向を参照しながらアノテーションを行う枠組みを導入し,その有効性を検証した。(2)については,言語情報と画像情報を統合した画像検索手法を提案し,講義用教材の検索においてその有効性を確かめた。また,複数の音声認識器の辞書を階層化することで,より高精度な音声理解を実現した。さらにジェスチャ認識では,SVMによるバッチ学習とパーセプトロンによるオンライン学習を統合し,使用環境や使用者の変化にロバストな認識手法を提案・実装し,その有効性を確認した。(3)については,(2)で実装した音声認識器とジェスチャ認識器を統合し,写真管理ソフトにおける画像の選択や拡大・縮小などの操作,音楽再生ソフトにおける再生,停止,音量調整などの操作を,ジェスチャと音声で行うことのできるマルチモーダルインタフェースを試作した。

  • 研究成果

    (7件)

すべて 2010 2009

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (6件)

  • [雑誌論文] Recurrent Neural Network Classifier for Three Layer Conceptual Network and Performance2010

    • 著者名/発表者名
      Md.Khalilur Rhaman, Tsutomu Endo
    • 雑誌名

      JOURNAL OF COMPUTERS Vol.5

      ページ: 40-48

    • 査読あり
  • [学会発表] SVMと逐次学習を併用したHOG特徴による手形状認識手法2010

    • 著者名/発表者名
      武藤亮介, 嶋田和孝, 遠藤勉
    • 学会等名
      電子情報通信学会, パターン認識・メディア理解研究会(PRMU)
    • 発表場所
      鹿児島大学
    • 年月日
      2010-03-16
  • [学会発表] 階層化された複数の音声認識器を選択的に利用する音声理解手法2010

    • 著者名/発表者名
      横山貴彦, 嶋田和孝, 遠藤勉
    • 学会等名
      情報処理学会創立50周年記念第72回全国大会
    • 発表場所
      東京大学
    • 年月日
      2010-03-10
  • [学会発表] 複数の音声認識器とマーカを用いたマルチモーダルインターフェース2010

    • 著者名/発表者名
      武藤亮介, 嶋田和孝, 遠藤勉
    • 学会等名
      情報処理学会創立50周年記念第72回全国大会
    • 発表場所
      東京大学
    • 年月日
      2010-03-09
  • [学会発表] Web image retrieval for abstract queries using text and image information2009

    • 著者名/発表者名
      Kazutaka Shimada, Suguru Ishikawa, Tsutomu Endo
    • 学会等名
      Proceedings of The Fifth Asia Information Retrieval Symposium(AIRS 2009)
    • 発表場所
      北海道大学
    • 年月日
      2009-10-22
  • [学会発表] 複数の認識器を選択的に利用する音声理解手法のマルチモーダルインタフェースへの適用2009

    • 著者名/発表者名
      横山貴彦, 嶋田和孝, 遠藤勉
    • 学会等名
      第17回電子情報通信学会九州支部学生会
    • 発表場所
      九州工業大学
    • 年月日
      2009-09-29
  • [学会発表] Effective construction and expansion of a sentiment corpus using anexisting corpus and evaluative criteria estimation2009

    • 著者名/発表者名
      Ryosuke Tadano, Kazutaka Shimada, Tsutomu Endo
    • 学会等名
      Proceedings of the 11th Conference of the Pacific Association for Computational Linguistics
    • 発表場所
      北海道大学
    • 年月日
      2009-09-03

URL: 

公開日: 2011-06-16   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi