• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2008 年度 実績報告書

音響信号記号変換に基づいたセマンティックインタラクション

研究課題

研究課題/領域番号 19024042
研究機関京都大学

研究代表者

奥乃 博  京都大学, 情報学研究科, 教授 (60318201)

研究分担者 高橋 徹  京都大学, 情報学研究科, 助教 (30419494)
キーワードロボット聴覚 / 音響信号記号変換 / ブラインド音源分離 / 発達論的コミュニケーション / ミッシングフィーチャ理論 / 聖徳太子コンピュータ / HARK / 音環境可視化技術
研究概要

(1)「音を聞き分ける」音の量的爆発促進技術 :
使用環境, 設置条件に関する事前知識量を極力減らした実時間ロボット聴覚ソフトウエア「HARK」を5月から公開を始め, 11月に京都大学で, 12月には韓国KISTで無料講習会を開催した. 今年度開発したHARKの新機能は, 従来の2値マスクから連続値のソフトマスクによるミッシングフィーチャマスク自動生成法であり, 音声認識率が10%程度向上した. また, ロボットの自己生成音を抑制するICAによるセミブラインド分離法も開発し, 音楽ロボットに応用した. すなわち, ロボットが自分の出す歌声やハミングの影響を抑制し, 音楽だけを聞いて実時間でビート認識する音楽ロボットを開発した. IEEE/RSJ IROS-2008発表の2本の論文が, Award for Entertainment Robots and Systems (NTF Award) Nomination Finalist 4件中の2件に選ばれた.
(2)「音を見せる」音の質的複雑さ軽減技術 :
HARKと3D viewerを組み合わせた音環境可視化システムに, 既開発の俯瞰モードでの機能拡充,及び, 没入感モードでの「音アウエアネス」提示機能を開発した. 前者は, 音環境の早送り提示, 音声認識結果のカラオケ風表示, 及び, 機能の洗練化である. 後者に対しては, 音の気付きという音アウエアネスを向上させるには, 単なる高忠実音場再生ではなく, 分離合成というプロセスが不可欠であるという観点から取り組んだ. 人の動きは, ディスプレイ上に設置したステレオカメラで取得した画像データから色情報を用いた最近傍探索で認識している. 音の没入モードでの提示に分離合成というアプローチは他に例がなく, 今後の展開の可能性が示唆された.

  • 研究成果

    (43件)

すべて 2009 2008 その他

すべて 雑誌論文 (12件) (うち査読あり 11件) 学会発表 (25件) 備考 (1件) 産業財産権 (5件) (うち外国 2件)

  • [雑誌論文] 歌声の統計的モデル化とビタビ探索を用いた多重奏中のボーカルパートに対する音高推定手法2009

    • 著者名/発表者名
      藤原弘将, 後藤真孝, 奥乃博
    • 雑誌名

      情報処理学会論文誌 Vol.50, No.3

      ページ: 1054-1066

    • 査読あり
  • [雑誌論文] 音色特徴の歪みを回避した楽器音の音高・音長操作手法2009

    • 著者名/発表者名
      安部武宏, 糸山克寿, 吉井和佳, 駒谷和範, 尾形哲也, 奥乃博
    • 雑誌名

      情報処理学会論文誌 Vol.50, No.3

      ページ: 1054-1066

    • 査読あり
  • [雑誌論文] Game-Theoretic Model of Referential Coherence and Its Empirical Verification Using Lame Japanese and English Corpora2009

    • 著者名/発表者名
      Shun Shiramatsu, Kazunori Komatani, Koiti Hasida. Tetsuva Oaata. Hiroshi G. Okuno
    • 雑誌名

      ACM Transactions on Speech and Language Processing Vo.5, No.3

      ページ: 6

    • 査読あり
  • [雑誌論文] 分析時刻に依存しない周期信号のパワースペクトル推定法を用いた音声分析2009

    • 著者名/発表者名
      森勢将雅, 高橋徹, 河原英紀, 入野俊夫
    • 雑誌名

      電子情報通信学会論文誌 Vol.J92-A. No.3

      ページ: 163-171

    • 査読あり
  • [雑誌論文] 独立成分分析に基づく適応フィルタのロボット聴覚への応用2008

    • 著者名/発表者名
      武田龍, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博
    • 雑誌名

      日本ロボット学会誌 Vol.26, No.6

      ページ: 529-536

    • 査読あり
  • [雑誌論文] A Portable Robot Audition Software System for Multiple Simultaneous Speech Signals2008

    • 著者名/発表者名
      Hiroshi G Okuno, Shun' ichi Yamamoto, Kazuhiro Nakadai, J-M. Valin, Kazunori Komatani, Tetsuya Ogata
    • 雑誌名

      Journal of Acoustic Society of America Vol.123, No.5

      ページ: 3066-3067

    • 査読あり
  • [雑誌論文] Predicting Object Dynamics from Visual Images through Active Sensing Experiences2008

    • 著者名/発表者名
      Shun Nishide, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno
    • 雑誌名

      Advanced Robotics Vol.22, No.5

      ページ: 527-546

    • 査読あり
  • [雑誌論文] SalienceGraph : Visualizing Salience Dynamics of Written Discourse by Using Reference Probability and PLSA2008

    • 著者名/発表者名
      Shun Shiramatsu, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
    • 雑誌名

      PRICAI-2008 : Trends in Artificial Intelligence LNCS Vol.5351

      ページ: 890-902

    • 査読あり
  • [雑誌論文] A temporally stable representation of power spectra of periodic signals and its application to F0 and periodicity estimation2008

    • 著者名/発表者名
      Hideki Kawahara, M. Morise, Toru Takahashi. R. Nishimura. H. Banno. T. Irino
    • 雑誌名

      Journal of Acoustic Society of America Vol.123, No.5

      ページ: 3074-3075

    • 査読あり
  • [雑誌論文] 多数の人の声を一度に聞き分ける聴覚センサ2008

    • 著者名/発表者名
      奥乃博
    • 雑誌名

      日経工レクトロニクス 2008年9月22日号

      ページ: 115-123

  • [雑誌論文] Vowel Imitation using Vocal Tract Model and Recurrent Neural Network2008

    • 著者名/発表者名
      Hisashi Kanda, Tetsuya Ogata, Kazunori Komatani, Hiroshi G. Okuno
    • 雑誌名

      New Frontiers in Applied Artificial Intelligence LNAI Vol.5027

      ページ: 294-304

    • 査読あり
  • [雑誌論文] Motion Emergence from Sound using Cross-Modal Mapping on Recurrent Neural Network2008

    • 著者名/発表者名
      Tetsuya Ogata, Hiroshi G. Okuno
    • 雑誌名

      IEEE Intelligent System Vol.23, No.2

      ページ: 74-84

    • 査読あり
  • [学会発表] フィールドにおける音源定位のための音声視覚化デバイス「カエルホタル」の設計2009

    • 著者名/発表者名
      水本武志, 合原一究, 高橋徹, 尾形哲也, 奥乃博
    • 学会等名
      情報処理学会第71回全国大会
    • 発表場所
      立命館大学, 草津
    • 年月日
      2009-03-12
  • [学会発表] Design and Implementation of 3D Auditory Scene Visualizer towards Auditory Awareness with Face Tracking2008

    • 著者名/発表者名
      Yuji Kubota, Masatoshi Yoshida, Kazunori Komatani, Tetsuva Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of IEEE International Symposium on Multimedia (ISM08)
    • 発表場所
      Berkeley, U. S. A
    • 年月日
      2008-12-16
  • [学会発表] 3D Auditory Scene Visualizer With Face Trackingn : Design and Implementation For Auditory Awareness Compensation2008

    • 著者名/発表者名
      Yuji Kubota, Shun Shiramatsu, Kazunori Komatani. Tetsuva Ogata. Hiroshi G. Okurio
    • 学会等名
      Proceedings of 2nd International Symposium on Universal Communication (ISUC2008)
    • 発表場所
      Osaka, Japan
    • 年月日
      2008-12-15
  • [学会発表] A Beat-Tracking Robot for Human-Robot Interaction and Its Evaluation2008

    • 著者名/発表者名
      Kazumasa Murata, Kazuhiro Nakadai, Ryu Takeda, Hiroshi G. Okuno, T. Torii, Y. Hasegawa, H. Tsujino
    • 学会等名
      Proceedings of IEEE-RAS Interanational Conference on Humanoid Robots (Humanoids 2008)
    • 発表場所
      Daejeon, Korea
    • 年月日
      2008-12-03
  • [学会発表] Computational Auditory Scene Analysis and Its Application to Robot Audition (Invited Talk)2008

    • 著者名/発表者名
      Hiroshi G. Okuno
    • 学会等名
      Proceedings of the Second International Symposium on Robotics and Artificial Intelligence
    • 発表場所
      Chofu, Japan
    • 年月日
      2008-10-09
  • [学会発表] An Open Source Software System For Robot Audition HARK and Its Evaluation2008

    • 著者名/発表者名
      Kazuhiro Nakadai, Hiroshi G. Okuno, Hirofumi Nakajima, Yuji Hasegawa, Hiroshi Tsujino
    • 学会等名
      Proceedings of IEEE-RAS Interanational Conference on Humanoid Robots (Humanoids 2008)
    • 発表場所
      Nice, France
    • 年月日
      2008-09-24
  • [学会発表] Soft Missing-Feature Mask Generation for Simultaneous Speech Recognition System in Robots2008

    • 著者名/発表者名
      Toni Takahashi, Shunichi Yamamoto, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of International Conference on Spoken Language Processing (Interspeech-2008)
    • 発表場所
      Brisbane, Australia
    • 年月日
      2008-09-24
  • [学会発表] Spectral Envelope Recovery beyond the Nyquist Limit for High-Quality Manipulation of Speech Sounds2008

    • 著者名/発表者名
      Hideki Kawahara, Masanori Morise, Hideki Banno, Toni Takahashi, Ryuichi Nishimura, Toshio Irino
    • 学会等名
      Proceedings of International Conference on Spoken Language Processing (Interspeech-2008)
    • 発表場所
      Brisbane, Australia
    • 年月日
      2008-09-24
  • [学会発表] A Robot Listens to Music and Counts Its Beats Aloud by Separating Music from Counting Voice2008

    • 著者名/発表者名
      Takeshi Mizumoto, Ryu Takeda, Kazuyoshi Yoshii, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2008)
    • 発表場所
      Nice, France
    • 年月日
      2008-09-24
  • [学会発表] Segmenting Acoustic Signal with Articulatory Movement using Recurrent Neural Network for Phoneme Acauisition2008

    • 著者名/発表者名
      Hisashi Kanda, Tetsuya Ogata, Kazunori Komatani Hiroshi G. Okuno
    • 学会等名
      Proceedings of IEEE/RSJ International Conference on intelligent Robots and Systems (IROS-2008)
    • 発表場所
      Nice, France
    • 年月日
      2008-09-24
  • [学会発表] Target Speech Detection and Separation for Humanoid Robot in Sparse Dialogue with Noisy Home Environments2008

    • 著者名/発表者名
      Hyun-Don Kim, Jinsung Kim, Kazunori Komatani. Tetsuva Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2008)
    • 発表場所
      Nice, France
    • 年月日
      2008-09-24
  • [学会発表] A Robot Uses Its Own Microphone to Synchronize Its Steps to Musical Beats While Scatting and Singing2008

    • 著者名/発表者名
      K. Murata, K. Nakadai, K. Yoshii, Ryu Takeda, T. Torii, Hiroshi G. Okuno, Y. Hasegawa, H. Tsujino
    • 学会等名
      Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2008)
    • 発表場所
      Nice, France
    • 年月日
      2008-09-24
  • [学会発表] Design and Evaluation of Two-Channel Sound Source Localization over Entire Azimuth Range for Moving Talker2008

    • 著者名/発表者名
      Hyun-Don Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2008)
    • 発表場所
      Nice, France
    • 年月日
      2008-09-24
  • [学会発表] Barge-in-able Robot Audition Based on ICA and Missing Feature Theory under Semi-Blind Situation2008

    • 著者名/発表者名
      Ryu Takeda, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2008)
    • 発表場所
      Nice, France
    • 年月日
      2008-09-24
  • [学会発表] Active Ssensing based Dynamical Object Feature Extraction2008

    • 著者名/発表者名
      Shun Nishide, Tetsuya Ogata, Ryunosuke Yokoya, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno
    • 学会等名
      Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2008)
    • 発表場所
      Nice, France
    • 年月日
      2008-09-23
  • [学会発表] Analysis of Reliable Predictability based Motion Generation using RNNP2008

    • 著者名/発表者名
      Shun Nishide, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno
    • 学会等名
      Proc. of Joint 4th International Conf. on Soft Computing and Intelligent Systems and 9th International Symposium on advanced Intelligent Systems (SCIS & ISIS 2008)
    • 発表場所
      Nagoya, Japan
    • 年月日
      2008-09-18
  • [学会発表] A Robot Uses Its Own Microphone to Synchronize Its Steps to Musical Beats While Scatting and Singing2008

    • 著者名/発表者名
      K. Murata, K. Nakadai, K. Yoshii, Ryu Takeda, T. Torii, Hiroshi G. Okuno, Y. Hasegawa, H. Tsujino
    • 学会等名
      Proceedings of 9th International Conference on Musical Information Retreival (ISMIR-2008)
    • 発表場所
      Nice, France
    • 年月日
      2008-09-15
  • [学会発表] ミッシングフィーチャ理論に基づく複数話者同時発話音声認識における音響特徴量とマスクの検討2008

    • 著者名/発表者名
      高橋徹, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博
    • 学会等名
      日本音響学会2008年秋季研究発表会講演論文集
    • 発表場所
      北九州
    • 年月日
      2008-09-11
  • [学会発表] ロボット聴覚のためのソフトマスク生成法による周辺話者音声認識率の改善2008

    • 著者名/発表者名
      高橋徹, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博
    • 学会等名
      日本ロボット学会第26回学術講演会
    • 発表場所
      神戸大学, 神戸
    • 年月日
      2008-09-09
  • [学会発表] Synthesis Approach for Manipulating Pitch of a Musical Instrument Sound with Considering Timbral Characteristics2008

    • 著者名/発表者名
      Takehiro Abe, Katsutoshi Itoyama, K.Yoshii, K. Komatani. T. Ogata. Hiroshi G. Okuno
    • 学会等名
      Proceeding of the 11th International Conference on Digital Audio Effects (DAFx-28)
    • 発表場所
      Espoo, Finland
    • 年月日
      2008-09-01
  • [学会発表] A Portable Robot Audition Software System for Multiple Simultaneous Speech Signals2008

    • 著者名/発表者名
      Hiroshi G. Okuno, Shun' ichi Yamamoto, Kazuhiro Nakadai, J-M. Valin, Kazunori Komatani, T. Ogata
    • 学会等名
      Proceedings of Acoustics' 08
    • 発表場所
      Paris, France
    • 年月日
      2008-06-30
  • [学会発表] Object Dynamics Prediction and Motion Generation based on Reliable Predictability2008

    • 著者名/発表者名
      Shun Nishide, Tetsuya Ogata, Ryunosuke Yokoya, Jun Tani, Kazunori Komatani, Hiroshi G. Okuno-
    • 学会等名
      Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2008)
    • 発表場所
      Pasadena, U. S. A
    • 年月日
      2008-05-20
  • [学会発表] A Robot Referee for Rock-Paper-Scissors Sound Games2008

    • 著者名/発表者名
      Kazuhiro Nakadai, Shun' ichi Yamamoto, Hiroshi G. Okuno, H. Nakajima, Y. Hasegawa, H. Tsujino
    • 学会等名
      Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2008)
    • 発表場所
      Pasadena, U. S. A
    • 年月日
      2008-05-20
  • [学会発表] Two-Channel-Based Voice Activity Detection for Humanoid Robots in Noisy Home Environments2008

    • 著者名/発表者名
      Hyun-Don Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
    • 学会等名
      Proceedings of IEEE-RAS International Conference on Robotics and Automation (ICRA-2008)
    • 発表場所
      Pasadena, U. S. A
    • 年月日
      2008-05-20
  • [学会発表] COMPUTATIONAL AUDITORY SCENE ANALYSIS AND ITS APPLICATION TO ROBOT AUDITION2008

    • 著者名/発表者名
      Hiroshi G. Okuno, Kazuhiro Nakadai
    • 学会等名
      Proceedings of Hands-free Speech Communication and Microphone Arrays (HSCMA-2008)
    • 発表場所
      Trio, Italy
    • 年月日
      2008-05-07
  • [備考]

    • URL

      http://winnie.kuis.kyoto-u.ac.jp/

  • [産業財産権] 音楽音響信号の音色変更システム2009

    • 発明者名
      安部武宏, 糸山克寿, 奥乃博
    • 権利者名
      国立大学法人京都大学
    • 産業財産権番号
      2009-34664号
    • 出願年月日
      2009-02-17
  • [産業財産権] 文単位検索方法, 文単位検索装置コンピュータプログラム, 記憶媒体,及び文書記憶装置2008

    • 発明者名
      白松俊, 駒谷和範, 奥乃博
    • 権利者名
      国立大学法人京都大学
    • 産業財産権番号
      PCT/JP2007/055448
    • 出願年月日
      2008-12-12
    • 外国
  • [産業財産権] Moving object equipped with ultra-directional speaker2008

    • 発明者名
      Kiyofurni Mori. Shunji Yoshida. Hiroshi Okuno, Kazuhiro Nakadai. Hiroshi Tsujino
    • 権利者名
      三菱電機エレクトロニクス, 本田技研工業
    • 産業財産権番号
      Patent No. US 7, 424, 118
    • 取得年月日
      2008-09-09
    • 外国
  • [産業財産権] 音源分離システム2008

    • 発明者名
      武田龍, 中臺一博, 辻野広司, 奥乃博
    • 権利者名
      本田技研工業
    • 産業財産権番号
      2008-191382号
    • 出願年月日
      2008-07-24
  • [産業財産権] 音声認識装置2008

    • 発明者名
      中臺一博, 辻野広司, 奥乃博, 山本俊一
    • 権利者名
      本田技研工業
    • 産業財産権番号
      4157581号
    • 取得年月日
      2008-07-18

URL: 

公開日: 2010-06-11   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi