• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2007 年度 実績報告書

ロボットを対象とした視聴覚音声認識の研究

研究課題

研究課題/領域番号 19700158
研究機関東京工業大学

研究代表者

中臺 一博  東京工業大学, 大学院・情報理工学研究科, 客員准教授 (70436715)

キーワードロボット聴覚 / 音声認識 / 視聴覚統合 / ミッシングフィーチャ理論 / Coarse-to-Fine認識
研究概要

H19年度は、(1)高速カメラを用いた視聴見同期収録シスアムの構築、(2)視聴音声認識用DBの作成、(3)唇検出手法の有効性検証、(4)音素・口形素グループ手法の確立といった当初計画に対して、ほぼ遅滞なく研究を進めることができた。(1)、(2)に関しては、構築した視聴覚データ収録システムを用いて、画像lOOHz,音声16kHzで25名各400単語からなる日本語視聴覚音声認識用DBを構築した。特に、これまで存在していなかった高フレームレートの視聴覚DBを構築できた点では、大きな学術的意義があると考える。実際に、このDBを用いて(3)にかかる実験を行い、フレームレートが高いほど一般的に認識率が高くなるという知見を得ることができた(成果をIROS2007やSI2007で発表)。(4)に関しては、口形素・音素クルーピンクのうち、主に音素クルーピンクの方法に注力した。成果として、雑音で判別が難しい音素同士を方向性を待った非対称なクルーピンクを行うことによって、雑音下の音声認識率が向上することを示した(成果をIEA/AIE 2007で発表,および論文化しか)。さらに、一部計画を前倒しして、H20年度に実施する予定であったミッシングフィーチヤ理論の導心診討を行った。オフライン実験ではあるが、この手法の導入によって、-5dBという高雑音下で、200語の孤立単語認識で、50ポイント程度性能を向上させることができることを示した(成果をIROS2007,ロボット学会学術講演会で発表)。(3),(4)に関しては、より性能を高められるよう研究を継続し、H20年度の最終目標である実ロボットへの搭載に向けた研究を進める予定である。

  • 研究成果

    (8件)

すべて 2007

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (6件)

  • [雑誌論文] The Design of Phoneme Grouping for Coarse Phoneme Recognition2007

    • 著者名/発表者名
      Kazuhiro Nakadai, Ryota Sumiya, Mikio Nakano, Koichi Ichige, Yasuo Hirose, Hiroshi Tsujino
    • 雑誌名

      Lecture Notes in Computer Science, New Trends in Applied Artificial Intelligence 4570/2007

      ページ: 905-914

    • 査読あり
  • [雑誌論文] 肺癌統合によ実環境音環境理解〜マイクロホンアレイ統合による音源追跡〜2007

    • 著者名/発表者名
      中臺, 一博
    • 雑誌名

      「計測と制御」 特集・解説ロボット聴覚のためのインテグレーション技術 46

      ページ: 427-433

    • 査読あり
  • [学会発表] 視聴覚音声認識における唇検出手法の検討2007

    • 著者名/発表者名
      小岩 智明, 中臺一博, 井村 順一
    • 学会等名
      SICE システムインテグレーション部門大会 SI 2007
    • 発表場所
      広島、日本
    • 年月日
      2007-12-22
  • [学会発表] ロボットによるビートトラッキングにおける周期性自己発生音の影響評価2007

    • 著者名/発表者名
      村田 和真, 吉井 和佳, 奥乃 博, 鳥井 豊隆, 中臺 一博, 長谷川 雄二
    • 学会等名
      SICE システムインテグレーション部門大会 SI 2007
    • 発表場所
      広島、日本
    • 年月日
      2007-12-22
  • [学会発表] Robot Audition towards real-world computational auditory scene analysis2007

    • 著者名/発表者名
      Kazuhiro Nakadai
    • 学会等名
      The 2nd International Symposium on Design of Artificial Environments
    • 発表場所
      福岡、日本
    • 年月日
      2007-11-29
  • [学会発表] Coarse Speech Recognition by Audio-Visual Integration based on Missing Feature Theory2007

    • 著者名/発表者名
      Tomoaki Koiwa, Kazuhiro Nakadai, Jun-ichi Imura
    • 学会等名
      IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2007)
    • 発表場所
      サンディェゴ、アメリカ
    • 年月日
      2007-10-30
  • [学会発表] ロボットを対象とした視聴覚音声認識の検討- 音素・口形素クルービッグとミッシングフィーチヤー理論に基づくアプローチー2007

    • 著者名/発表者名
      小岩 智明, 中臺 一博, 井村 順一
    • 学会等名
      日本ロボット学会第25回学術講演会
    • 発表場所
      千葉、日本
    • 年月日
      2007-09-14
  • [学会発表] Coarse Phoneme Recognition Using Phoneme Grouping and Its Application to Isolated Word Recognition2007

    • 著者名/発表者名
      Kazuhiro Nakadai, R. Sumiya, K. Ichige, Y. Hirose, M. Nakano、H. Tsujino
    • 学会等名
      The 20th Int'l Conf. on Industrial, Engineering &Other Applications of Applied Intelligent Systems (IEA/AIE-2007)
    • 発表場所
      京都、日本
    • 年月日
      2007-06-27

URL: 

公開日: 2010-02-04   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi