• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2004 Fiscal Year Annual Research Report

ヒューマノイドのためのアクティブ・オーディションを用いた音環境理解の研究

Research Project

Project/Area Number 15200015
Research InstitutionKyoto University

Principal Investigator

奥乃 博  京都大学, 情報学研究科, 教授 (60318201)

Co-Investigator(Kenkyū-buntansha) 駒谷 和範  京都大学, 情報学研究科, 助手 (40362579)
後藤 真孝  独立行政法人 産業技術総合研究所, 情報処理研究部門, 研究員
中臺 一博  (株)ホンダ・リサーチ・インスティチュート・ジャパン, シニア・リサーチャー
和田 俊和  和歌山大学, システム工学部, 教授 (00231035)
宮原 誠  北陸先端科学技術大学院大学, 情報科学研究科, 教授 (00115122)
Keywordsロボット聴覚 / ミッシングフィーチャー理論 / 自動マスク生成 / 黄忠実音再生システム / 対人距離によるインタラクション / 色ターゲット検出 / 環境音の擬音語自動認識 / 楽器音自動認識・歌手認識
Research Abstract

第2年目の主たる成果は以下の通りである。
(1)対人距離に基づくインタラクションモデルの詳細化:昨年度開発したモデルを個別ロボットのセンサ機能や出力装置に合わせて詳細化する手法を開発し、デモで有効性を実証した。また、その成果は国際会議で発表するとともに、ジャーナル論文にも掲載された。
(2)ミッシングフィーチャ理論に基づく分離音声認識システムの汎用性の確認:方向や話者に依存した音響モデルを使用せず、話者独立のクリーンな単一の音響モデルで3話者同時発話認識を行うために、動的に欠落特徴が扱えるミッシングフィーチャ理論に基づいた音声認識システムを開発し、正解から作成する演繹ミッシングマスクにより、分離音の認識精度が大幅に向上することを、異種のヒューマノイドロボットSIG2・Replie・ASIMO上で実証し、本手法の一般性を確認した。その成果はジャーナル論文に採録された。
(3)自動ミッシングフィーチャマスク生成法の開発:(2)の汎用性の確認を受け、2本のマイクロフォンによる音源分離システムADPFで自動マスク生成を試みたが、うまくいかなかった。そのため、8本のマイクロフォンアレイを用いた幾何学的音源分離法とマルチチャネルポストフィルタから得られるチャネル間干渉情報に基づいた自動マスク生成法を開発し、3話者同時発話認識が演繹マスクの性能の80%まで改善した。
(4)音一般の認識と対話システムへの展開:環境音を擬音語でタグ付けをし、環境音を擬音語で検索できるシステムを開発した。音声対話では人が聞き間違える可能性を削減するために付加表現生成法を開発した。また、楽器音認識や歌手認識にも取り組んだ。
(5)顔追跡・識別・視線方向追跡法の開発:インタラクション高度化のために顔追跡と識別を同時処理する手法を開発し、白目と黒目との境界に注目した視線方向追跡法を開発した。
(6)超忠実音再生システムの導入:宮原教授開発システムを導入し、再現性の高い音響実験が可能となった。

  • Research Products

    (21 results)

All 2005 2004

All Journal Article (19 results) Book (1 results) Patent(Industrial Property Rights) (1 results)

  • [Journal Article] A computational model of monkey cortical grating cells2005

    • Author(s)
      Tino Lourens, Hiroshi G.Okuno, Hiroshi Tsujino
    • Journal Title

      Biological Cybernetics 92・1

      Pages: 61-70

  • [Journal Article] 環境音を対象とした擬音語自動認識2005

    • Author(s)
      石原 一志, 駒谷 和範, 尾形 哲也, 奥乃 博
    • Journal Title

      人工知能学会論文誌 20・3

      Pages: 229-236

  • [Journal Article] Dynamic Communication of Humanoid Robot with Multiple People Based on Interaction Distance2005

    • Author(s)
      Tsuyoshi Tasaki, Shohei Matsumoto, Hayato Ohba, Shun'ichi Yamamoto, Mitsuhiko Toda, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.Okuno
    • Journal Title

      人工知能学会論文誌 20・3

      Pages: 209-219

  • [Journal Article] 複数の編集距離を用いた口語翻訳文の自動評価2005

    • Author(s)
      秋葉 泰弘, 今村 賢治, 隅田 英一郎, 中岩 浩巳, 山本 誠一, 奥乃 博
    • Journal Title

      人工知能学会論文誌 20・3

      Pages: 139-148

  • [Journal Article] ミッシングフィーチャ理論を利用した音源分離と音声認識のインターフェースと複数ロボットへの適用2005

    • Author(s)
      山本 俊一, 中臺 一博, 辻野 広司, 奥乃 博
    • Journal Title

      日本ロボット学会誌 23・4(印刷中)

  • [Journal Article] Sound and Visual Tracking for Humanoid Robot2004

    • Author(s)
      Hiroshi G.Okuno, Kazuhiro Nakadai, Tino Lourens, Hiroaki Kitano
    • Journal Title

      Applied Intelligence 20・3

      Pages: 253-266

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] 音声対話システムにおける適応的な応答生成を行うためのユーザモデル2004

    • Author(s)
      駒谷和範, 上野晋一, 河原達也, 奥乃 博
    • Journal Title

      電子情報通信学会論文誌 87-D2・10

      Pages: 1921-1928

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] Effects of increasing modalities in recognizing three simultaneous speeches2004

    • Author(s)
      Hiroshi G.Okuno, Kazuhiro Nakadai, Hiroaki Kitano
    • Journal Title

      Speech Communication 43・4

      Pages: 347-359

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] Improvement of Recognition of Simultaneous Speech Signals Using AV Integration and Scattering Theory for Humanoid Robots2004

    • Author(s)
      Kazuhiro Nakadai, Daisuke Matsuura, Hiroshi G.Okuno, Hiroshi Tsujino
    • Journal Title

      Speech Communication 44・1

      Pages: 97-112

  • [Journal Article] 最近傍識別による背景差分と色検出の統合-事例に基く情報統合-2004

    • Author(s)
      加藤丈和, 和田俊和
    • Journal Title

      情報処理学会論文誌:コンピュータビジョンとイメージメディア 45・SIG13(CVIM10)

      Pages: 110-117

  • [Journal Article] 階層的句アライメントを用いた統計的機械翻訳2004

    • Author(s)
      渡邊太郎, 今村, 隅田英一郎, 奥乃 博
    • Journal Title

      電子情報通信学会論文誌 J87-D2・4

      Pages: 978-986

  • [Journal Article] Improvement of Robot Audition by Interfacing Sound Source Separation and Automatic Speech Recognition with Missing Feature Theory2004

    • Author(s)
      Shun'ich Yamamoto, Kazuhiro Nakadai, Hiroshi Tsujino, Toshio Yokoyama, Hiroshi G.Okuno
    • Journal Title

      Proceedings of IEEE-RAS International Conference on Robots and Automation (ICRA-2004)

      Pages: 1517-1523

  • [Journal Article] Conic-Based Algorithm for Visual Line Estimation from One Image2004

    • Author(s)
      H.Wu, Q.Chen, Toshikazu Wada
    • Journal Title

      Proceedings of IEEE Conference on FG'04

      Pages: 260-265

  • [Journal Article] Comparing Features for Forming Music Streams in Automatic Music Transcription2004

    • Author(s)
      Yohei Sakuraba, Tetsuro Kitahara, Hiroshi G.Okuno
    • Journal Title

      Proceedings of 2004 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP'2004) IV

      Pages: 273-276

  • [Journal Article] Category-level Identification of Non-registered Musical Instrument Sounds2004

    • Author(s)
      Tetsuro Kitahara, Masataka Goto, Hiroshi G.Okuno
    • Journal Title

      Proceedings of 2004 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP'2004) IV

      Pages: 253-256

  • [Journal Article] Recognition of Emotional States in Spoken Dialogue with a Robot2004

    • Author(s)
      Kazunori Komatani, Ryosuke Itoh, Tatusya Kawahara, Hiroshi G.Okuno
    • Journal Title

      Innovations in Applied Artificial Intelligence (IEA/AIE-04) LNA13029

      Pages: 413-423

  • [Journal Article] Automatic Sound-Imitation World Recognition from Environmental Sounds focusing on Ambiguity Problem in Determining Phonemes2004

    • Author(s)
      Kazushi Ishihara, Tomohiro Nakatani, Tetsuya Ogata, Hiroshi G.Okuno
    • Journal Title

      PRICAI 2004 : Trends in Artificial Intelligence LNA13157

      Pages: 909-918

  • [Journal Article] Efficient Confirmation Strategy for Large-scale Text Retrieval Systems with Spoken Dialogue Interface2004

    • Author(s)
      Kazunori Komatani, Teruhisa Misu, Tatsuya Kawahara, Hiroshi G.Okuno
    • Journal Title

      Proceedings of the 20th International Conference on Computational Linguistics (Coling-2004)

      Pages: 1100-1106

  • [Journal Article] Assessment of General Applicability of Robot Audition System by Recognizing Three Simultaneous Speeches2004

    • Author(s)
      Shun'ichi Yamamoto, Kazuhiro Nakadai, Hiroshi Tsujino, Hiroshi G.Okuno
    • Journal Title

      Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2004)

      Pages: 2111-2116

  • [Book] 人工知能学事典(Lisp)2005

    • Author(s)
      奥乃 博
    • Publisher
      共立出版(印刷中)
  • [Patent(Industrial Property Rights)] 音響信号処理方式, 音響信号処理装置, 音響信号処理システム及びコンピュータプログラム2004

    • Inventor(s)
      吉井和佳, 奥乃 博, 後藤真孝
    • Industrial Property Rights Holder
      京都大学・産業技術総合研究所
    • Industrial Property Number
      特願2004-181881号
    • Filing Date
      2004-06-23

URL: 

Published: 2006-07-12   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi