• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2007 Fiscal Year Annual Research Report

ロボットを対象とした視聴覚音声認識の研究

Research Project

Project/Area Number 19700158
Research InstitutionTokyo Institute of Technology

Principal Investigator

中臺 一博  Tokyo Institute of Technology, 大学院・情報理工学研究科, 客員准教授 (70436715)

Keywordsロボット聴覚 / 音声認識 / 視聴覚統合 / ミッシングフィーチャ理論 / Coarse-to-Fine認識
Research Abstract

H19年度は、(1)高速カメラを用いた視聴見同期収録シスアムの構築、(2)視聴音声認識用DBの作成、(3)唇検出手法の有効性検証、(4)音素・口形素グループ手法の確立といった当初計画に対して、ほぼ遅滞なく研究を進めることができた。(1)、(2)に関しては、構築した視聴覚データ収録システムを用いて、画像lOOHz,音声16kHzで25名各400単語からなる日本語視聴覚音声認識用DBを構築した。特に、これまで存在していなかった高フレームレートの視聴覚DBを構築できた点では、大きな学術的意義があると考える。実際に、このDBを用いて(3)にかかる実験を行い、フレームレートが高いほど一般的に認識率が高くなるという知見を得ることができた(成果をIROS2007やSI2007で発表)。(4)に関しては、口形素・音素クルーピンクのうち、主に音素クルーピンクの方法に注力した。成果として、雑音で判別が難しい音素同士を方向性を待った非対称なクルーピンクを行うことによって、雑音下の音声認識率が向上することを示した(成果をIEA/AIE 2007で発表,および論文化しか)。さらに、一部計画を前倒しして、H20年度に実施する予定であったミッシングフィーチヤ理論の導心診討を行った。オフライン実験ではあるが、この手法の導入によって、-5dBという高雑音下で、200語の孤立単語認識で、50ポイント程度性能を向上させることができることを示した(成果をIROS2007,ロボット学会学術講演会で発表)。(3),(4)に関しては、より性能を高められるよう研究を継続し、H20年度の最終目標である実ロボットへの搭載に向けた研究を進める予定である。

  • Research Products

    (8 results)

All 2007

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (6 results)

  • [Journal Article] The Design of Phoneme Grouping for Coarse Phoneme Recognition2007

    • Author(s)
      Kazuhiro Nakadai, Ryota Sumiya, Mikio Nakano, Koichi Ichige, Yasuo Hirose, Hiroshi Tsujino
    • Journal Title

      Lecture Notes in Computer Science, New Trends in Applied Artificial Intelligence 4570/2007

      Pages: 905-914

    • Peer Reviewed
  • [Journal Article] 肺癌統合によ実環境音環境理解〜マイクロホンアレイ統合による音源追跡〜2007

    • Author(s)
      中臺, 一博
    • Journal Title

      「計測と制御」 特集・解説ロボット聴覚のためのインテグレーション技術 46

      Pages: 427-433

    • Peer Reviewed
  • [Presentation] 視聴覚音声認識における唇検出手法の検討2007

    • Author(s)
      小岩 智明, 中臺一博, 井村 順一
    • Organizer
      SICE システムインテグレーション部門大会 SI 2007
    • Place of Presentation
      広島、日本
    • Year and Date
      2007-12-22
  • [Presentation] ロボットによるビートトラッキングにおける周期性自己発生音の影響評価2007

    • Author(s)
      村田 和真, 吉井 和佳, 奥乃 博, 鳥井 豊隆, 中臺 一博, 長谷川 雄二
    • Organizer
      SICE システムインテグレーション部門大会 SI 2007
    • Place of Presentation
      広島、日本
    • Year and Date
      2007-12-22
  • [Presentation] Robot Audition towards real-world computational auditory scene analysis2007

    • Author(s)
      Kazuhiro Nakadai
    • Organizer
      The 2nd International Symposium on Design of Artificial Environments
    • Place of Presentation
      福岡、日本
    • Year and Date
      2007-11-29
  • [Presentation] Coarse Speech Recognition by Audio-Visual Integration based on Missing Feature Theory2007

    • Author(s)
      Tomoaki Koiwa, Kazuhiro Nakadai, Jun-ichi Imura
    • Organizer
      IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2007)
    • Place of Presentation
      サンディェゴ、アメリカ
    • Year and Date
      2007-10-30
  • [Presentation] ロボットを対象とした視聴覚音声認識の検討- 音素・口形素クルービッグとミッシングフィーチヤー理論に基づくアプローチー2007

    • Author(s)
      小岩 智明, 中臺 一博, 井村 順一
    • Organizer
      日本ロボット学会第25回学術講演会
    • Place of Presentation
      千葉、日本
    • Year and Date
      2007-09-14
  • [Presentation] Coarse Phoneme Recognition Using Phoneme Grouping and Its Application to Isolated Word Recognition2007

    • Author(s)
      Kazuhiro Nakadai, R. Sumiya, K. Ichige, Y. Hirose, M. Nakano、H. Tsujino
    • Organizer
      The 20th Int'l Conf. on Industrial, Engineering &Other Applications of Applied Intelligent Systems (IEA/AIE-2007)
    • Place of Presentation
      京都、日本
    • Year and Date
      2007-06-27

URL: 

Published: 2010-02-04   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi