2009 年度実績報告書

音響信号記号変換に基づいたセマンティックインタラクション

公募研究

研究領域	情報爆発時代に向けた新しいIT基盤技術の研究
研究課題/領域番号	21013030
研究機関	京都大学
研究代表者	奥乃博京都大学, 情報学研究科, 教授 (60318201)
研究分担者	高橋徹京都大学, 情報学研究科, 助教 (30419494)
キーワード	ロボット聴覚 / 音響信号記号変換 / セミブラインド音源分離 / 発達論的コミュニケーション / ミッシングフィーチャ理論 / 自己生成音抑制 / 音楽ロボット / HARK
研究概要	(1) 音情報の量的爆発を促進するために【音を聞き分ける技術】に,(2) 音情報提示での複雑化を軽減するために【音を見せる技術】に,取り組んだ.具体的な項目は以下の通りである: (1) (1)「音を聞き分ける」:分離音認識・白己生成音抑制・移動話者対応・特徴量信頼度としてソフトマスク自動生成開発.音声認識性能が10ポイント向上. ・自己発話音抑制機能をセミブラインドICAで実現.同時に,反射・残響抑制も. (2)「音源方向を見せる」:ヒューマンコミュニケーション特性の測定・無響室で,多様な姿勢からの発声を測定し,姿勢による発声音の特徴変化を解析. ・解析データを基に,発声音の声質を発声者の姿勢(首の左右,上下)に応じて変更. (2) (3)「音を記号表現として見せる」:音情報可視化・テキストとの連携・音源同定・音環境用AuditoryScene XMLを設計.文書の談話展開と統合し,GUIを設計. ・突発性の異常音を同定する機能をMP(Matching Pursuit)とHMMで開発. (4)「音の記号表現に意味を与える」:高度インタラクションへの展開・音楽による協調のために,音楽ロボット用アンサンブル演奏法を設計. ・自己歌声や生成音を上記手法で抑制し,相手演奏に対する実時間楽譜追跡を開発. ・割込み発話であるバージイン発話での発話者意図推定のための特徴量抽出法を開発. 特記事項:米国Willow Garage社のロボットにロボット聴覚システムHARKを搭載. 音情報可視化システムをベースにGUIを開発.

研究成果
(44件)

すべて 2010 2009 その他

すべて雑誌論文 (12件) (うち査読あり 9件) 学会発表 (28件) 図書 (1件) 備考 (1件) 産業財産権 (2件) (うち外国 1件)

[雑誌論文] Blind Separation and Dereverberation of Speech Mixtures by Joint Optimization2010
- 著者名/発表者名
  Takuya Yoshioka, Tomohiro Nakatani, Masato Miyoshi, Hiroshi G.Okuno
- 雑誌名
  
  IEEE Transactions on Audio, Speech and Language Processing (印刷中)
- 査読あり
[雑誌論文] Soft Missing-Feature Mask Generation for Simultaneous Speech Recognition System in Robots2010
- 著者名/発表者名
  Toru Takahashi, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.Okuno
- 雑誌名
  
  PALADYN Journal of Behavioral Robotics Vol.1, No.1
  
  ページ: 37-47
- 査読あり
[雑誌論文] Voice awareness control for a humanoid robot consistent with its body posture and movements2010
- 著者名/発表者名
  Takuma Otsuka, Kazuhiro Nakadai, T.Takahashi, K.Komatani, T.Ogata, Hiroshi G.Okuno
- 雑誌名
  
  PALADYN Journal of Behavioral Robotics Vol.1, No.1
  
  ページ: 80-88
- 査読あり
[雑誌論文] A Modeling of Singing Voice Robust to Accompaniment Sounds and Its Application to Singer Identification and Vocal-Timbre-Similarity-Based Music Information2010
- 著者名/発表者名
  Hiromasa Fujihara, Masataka Goto, Tetsuro Kitahara Hiroshi G.Okuno
- 雑誌名
  
  IEEE Transactions on Audio, Speech and Language Processing Vol.18, No.3
  
  ページ: 638-648
- 査読あり
[雑誌論文] Design and Implementation of Robot Audition System "HARK"2010
- 著者名/発表者名
  K.Nakadai, H.G.Okuno, H.Nakajima, Y.Hasegawa, H.Tsujino
- 雑誌名
  
  Advanced Robotics (印刷中)
- 査読あり
[雑誌論文] ロポット聴覚の現状と課題2010
- 著者名/発表者名
  奥乃博
- 雑誌名
  
  日本ロボット学会誌 Vol.28, No.1
  
  ページ: 2-5
[雑誌論文] ロボット聴覚オープンソフトウエアHARK2010
- 著者名/発表者名
  奥乃博, 中臺一博
- 雑誌名
  
  日本ロボット学会誌 Vol.28, No.1
  
  ページ: 6-9
[雑誌論文] Binaural Active Audition for Humanoid Robots to Localize Speech over Entire Azimuth Range2009
- 著者名/発表者名
  Hyun-Don Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.Okuno
- 雑誌名
  
  Applied Bionics and Biomechanics Vo.6, No.3
  
  ページ: 355-368
- 査読あり
[雑誌論文] Target Speech Detection and Separation for Communication with Humanoid Robots in Noisy Home Environments2009
- 著者名/発表者名
  Hyun-Don Kim, Jinsung Kim, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.Okuno
- 雑誌名
  
  Advanced Robotics Vo.23, No.5
  
  ページ: 2093-2111
- 査読あり
[雑誌論文] Seif-Organization of Dynamic Object Features based on Bi-Directional Training2009
- 著者名/発表者名
  Shun Nishide, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G.Okuno
- 雑誌名
  
  Journal of Robotics & Mechatronics Vol.21, No.4
  
  ページ: 478-488
- 査読あり
[雑誌論文] 音楽ロボットのための実時間音楽情報処理2009
- 著者名/発表者名
  奥乃博,中臺一博, 大塚琢馬
- 雑誌名
  
  情報処理 Vo.50, No.8
  
  ページ: 729-734
[雑誌論文] Visualization-based Approaches to Support Context Sharing towards Public Involment Support System2009
- 著者名/発表者名
  Shun Shiramatsu, Yuji Kubota, Kazunori Komatani, Tetsuya Ogata, Toru Takahashi
- 雑誌名
  
  Opportunities and Challenges for Next-Generation Applied Intelligenc SCI 214
  
  ページ: 111-117
- 査読あり
[学会発表] MUSIC DEREVERBERATION USING HARMONIC STRUCTURE SOURCE MODEL AND WIENER FILTER2010
- 著者名/発表者名
  Naoki Yasuraoka, Takuya Yoshioka, Tomohiro Nakatani, Aatsushi Nakamura
- 学会等名
  2010 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2010)
- 発表場所
  Dallus, TX, USA.
- 年月日
  2010-03-16
[学会発表] 複数自由度を用いて音高特性モデルに基づく音高制御を行うテルミン演奏ロボットの開発2010
- 著者名/発表者名
  水本武志, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博
- 学会等名
  情報処理学会第72回全国大会
- 発表場所
  東京大学,本郷
- 年月日
  2010-03-11
[学会発表] スペクトル推定を用いたマイク数以上の同時発話に対する音声認識2010
- 著者名/発表者名
  平澤恭治, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博
- 学会等名
  情報処理学会第72回全国大会
- 発表場所
  東京大学,本郷
- 年月日
  2010-03-11
[学会発表] 環境音から擬音語への自動変換における特徴量抽出法の検討2010
- 著者名/発表者名
  山川暢英, 北原鉄朗, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博
- 学会等名
  情報処理学会第72回全国大会
- 発表場所
  東京大学,本郷
- 年月日
  2010-03-11
[学会発表] クラシック音楽理解能力拡張インターフェイスのための同音旋律音量推定手法と主旋律推定への応用2010
- 著者名/発表者名
  前澤陽, 後藤真孝, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博
- 学会等名
  情報処理学会第72回全国大会
- 発表場所
  東京大学,本郷
- 年月日
  2010-03-11
[学会発表] 調波非調波GMMに基づくMIDI演奏音響信号に対する音色・演奏表情操作2010
- 著者名/発表者名
  安良岡直希, 糸山克寿, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博
- 学会等名
  情報処理学会第72回全国大会
- 発表場所
  東京大学,本郷
- 年月日
  2010-03-11
[学会発表] Robot Musical Accompaniment : Real-time Synchronization using Visual Cue Recognition2010
- 著者名/発表者名
  Angelica Lim, 水本武志, 大塚琢馬, 高橋徹, 駒谷和範, 尾形哲也, 奥乃博
- 学会等名
  情報処理学会第72回全国大会
- 発表場所
  東京大学,本郷
- 年月日
  2010-03-11
[学会発表] 実環境音声認識のためのロボット聴覚システム開発とパラメータチューニング2010
- 著者名/発表者名
  高橋徹, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博
- 学会等名
  情報処理学会第72回全国大会
- 発表場所
  東京大学,本郷
- 年月日
  2010-03-11
[学会発表] Bowed String Sequence Estimation of a Violin Based on Adaptive Audio Signal Classification and Context-Dependent Error Correction2009
- 著者名/発表者名
  Akira Maezawa, Katsutoshi Itoyama, Toru Takahashi, Tetsuya Ogata, Hiroshi G.Okuno
- 学会等名
  IEEE International Symposium on Multimedia (ISM2009)
- 発表場所
  Atlanta, USA.
- 年月日
  2009-12-14
[学会発表] Voice quality manipulation for humanoid robots consistent with their head movements2009
- 著者名/発表者名
  Takuma Otsuka, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata
- 学会等名
  IEEE-RAS International Conference on Humanoid Robots (Humanoids 2009)
- 発表場所
  Paris, France
- 年月日
  2009-12-09
[学会発表] Automatic Speech Recognition Improved by Two-Layered Audio-Visual2009
- 著者名/発表者名
  Takumi Yoshida, Kazuhiro Nakadai, Hiroshi G.Okuno
- 学会等名
  IEEE-RAS International Conference on Humanoid Robots (Humanoids 2009)
- 発表場所
  Paris, France
- 年月日
  2009-12-09
[学会発表] Automatic Estimation of Reverberation Time with Robot Speech to Improve ICA-based Robot Audition2009
- 著者名/発表者名
  Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.
- 学会等名
  IEEE-RAS International Conference on Humanoid Robots (Humanoids 2009)
- 発表場所
  Paris, France
- 年月日
  2009-12-08
[学会発表] AIチャレンジの現状と課題(招待講演)2009
- 著者名/発表者名
  奥乃博
- 学会等名
  人工知能学会AIチャレンジ研究会
- 発表場所
  慶応義塾大学, 日吉
- 年月日
  2009-10-19
[学会発表] A NOVEL FRAMEWORK FOR RECOGNIZING PHONEMES OF SINGING VOICE IN POLYPHONIC MUSIC2009
- 著者名/発表者名
  Hiromasa Fujihara, Masataka Goto, Hiroshi G.Okuno
- 学会等名
  2009 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA 2009)
- 発表場所
  New York, NY, USA
- 年月日
  2009-10-18
[学会発表] Changing Timbre and Phrase in Existing Musical Performances as You Like2009
- 著者名/発表者名
  Naoki Yasuraoka, Takehiro Abe, K.Itoyama, K.Yoshii, Kazunori Komatani, Tetsuya Ogata
- 学会等名
  ACM Multimedia 2009
- 発表場所
  Beijing, China
- 年月日
  2009-10-18
[学会発表] Phoneme Acquisition Model based on Vowel Imitation using Recurrent Neural Network2009
- 著者名/発表者名
  Hisashi Kanda, T.Ogata, T.Takahashi, K.Komatani Hiroshi G, Okuno
- 学会等名
  IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2009)
- 発表場所
  St.Louis, USA
- 年月日
  2009-10-14
[学会発表] Step-size Parameter Adaptation of Multi-channel Semi-blind ICA with Piecewise Linear Model for Barge-in-able Robot Audition (Invited paper)2009
- 著者名/発表者名
  Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.
- 学会等名
  IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2009)
- 発表場所
  St.Louis, USA
- 年月日
  2009-10-13
[学会発表] Modeling Tool-Body Assimilation using Second-order Recurrent Neural Network2009
- 著者名/発表者名
  Shun Nishide, Tetsuhiro Nakagawa, Tetsuya Ogata, Jun Tani, Toru Takahashi, Hiroshi G.Okuno
- 学会等名
  IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2009)
- 発表場所
  St.Louis, USA
- 年月日
  2009-10-13
[学会発表] Missing-Feature-Theory-based Robust Simultaneous Speech Recognition System with Non-clean Speech Acoustic Model (Invited paper)2009
- 著者名/発表者名
  Toru Takahashi, Kazuhiro Nakadai, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.Okuno
- 学会等名
  IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2009)
- 発表場所
  St.Louis, USA
- 年月日
  2009-10-13
[学会発表] Emergence of Evolutional Interaction with Voice and Motion between Two Robots using RNN2009
- 著者名/発表者名
  Wataru Hinoshita, Tetsuya Ogata, Hideki Kozima, Hisashi Kanda, Toru Takahashi, Hiroshi G.Okuno
- 学会等名
  IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2009)
- 発表場所
  St.Louis, USA
- 年月日
  2009-10-13
[学会発表] Thereminist Robot : Development of a Robot Theremin Player with Feedforward and Feedback Arm Control based on a Theremin's Pitch Model (Invited paper)2009
- 著者名/発表者名
  Takeshi Mizumoto, Hiroshi Tsujino, Toru Takahashi, Tetsuya Ogata, Hiroshi G.Okuno
- 学会等名
  IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2009)
- 発表場所
  St.Louis, USA
- 年月日
  2009-10-13
[学会発表] Robot Auditon : Missing Feature Theory Approach and Active Audition (Invited talk)2009
- 著者名/発表者名
  Hiroshi G.Okuno, Kazuhiro Nakadai, Hyun-Don Kim
- 学会等名
  14th International Symposium of Robotics Research (ISRR 2009)
- 発表場所
  Lucerne, Switzerland
- 年月日
  2009-09-01
[学会発表] QUERY-BY-EXAMPLE MUSIC RETRIEVAL APPROACH BASED ON MUSICAL GENRE SHIFT BY CHANGING INSTRUMENT2009
- 著者名/発表者名
  Katsutoshi Itoyama, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.Okuno
- 学会等名
  12th International Conference on Digital Audio Effects (DAFx-09)
- 発表場所
  Como, Italy
- 年月日
  2009-09-01
[学会発表] Development of a Meeting Browser towards Supporting Public Involvement2009
- 著者名/発表者名
  Shun Shiramatsu, Tadachika Ozono, Toramatsu Shintani, K.Komatani, T.Ogata, T.Takahashi
- 学会等名
  12th IEEE International Conference on Computational Science and Engineering (CSE-09)
- 発表場所
  Vancouver, Canada
- 年月日
  2009-08-29
[学会発表] Analysis of Motion Searching based on Reliable Predictability using Recurrent Neural Network2009
- 著者名/発表者名
  Shun Nishide, Tetsuya Ogata, Jun Tani, Kazunori Komatani, Hiroshi G.Okuno
- 学会等名
  2009 IEEE/ASME Conference on Advanced Intelligent Mechatronics (AIM-2009)
- 発表場所
  Singapore
- 年月日
  2009-07-15
[学会発表] rediction and Imitation of Other's Motions by Reusing Own Forward-Inverse Model in Robots2009
- 著者名/発表者名
  Tetsuya Ogata, Ryunosuke Yokoya, Jun Tani, Kazunori Komatani, Hiroshi G.Okuno
- 学会等名
  IEEE-RAS International Conference on Robotics and Automation (ICRA-2009)
- 発表場所
  Kobe, Japan
- 年月日
  2009-05-16
[学会発表] Continuous Vocal Imitation with Self-organized Vowel Spaces in Recurrent Neural Network2009
- 著者名/発表者名
  Hisashi Kanda, Tetsuya Ogata, Toru Takahashi, Kazunori Komatani, Hiroshi G.Okuno
- 学会等名
  IEEE-RAS International Conference on Robotics and Automation (ICRA-2009)
- 発表場所
  Kobe, Japan
- 年月日
  2009-05-16
[学会発表] ICA-BASED EFFICIENT BLIND DEREVERBERATION AND ECHOCANCELLATION METHOD FOR BARGE-IN-ABLE ROBOT2009
- 著者名/発表者名
  Ryu Takeda, Kazuhiro Nakadai, Toru Takahashi, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.
- 学会等名
  2009 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2009)
- 発表場所
  Taipei, Taiwan
- 年月日
  2009-04-23
[図書] 『こころの謎kokoroの未来』(川添信介, 高橋康夫, 吉澤健吉編)2009
- 著者名/発表者名
  奥乃博:「ロボットと<こころ>」
- 総ページ数
  457
- 出版者
  京都大学出版会
[備考]
- URL
  http://winnie.kuis.kyoto-u.ac.jp/
[産業財産権] 音声認識装置及び音声認識装置のマスク生成法2009
- 発明者名
  中臺一博, 高橋徹, 奥乃博
- 権利者名
  本田技研工業
- 産業財産権番号
  特願2009-185164号
- 出願年月日
  2009-08-07
[産業財産権] Robotics visual and auditory system2009
- 発明者名
  K.Nakadai, H.Okuno, H.Kitano
- 権利者名
  科学技術振興事業団
- 産業財産権番号
  US 7, 526, 361
- 出願年月日
  2009-04-28
- 外国

2009 年度 実績報告書

音響信号記号変換に基づいたセマンティックインタラクション

研究代表者

奥乃 博 京都大学, 情報学研究科, 教授 (60318201)

研究成果

[雑誌論文] Blind Separation and Dereverberation of Speech Mixtures by Joint Optimization2010

著者名/発表者名

雑誌名

[雑誌論文] Soft Missing-Feature Mask Generation for Simultaneous Speech Recognition System in Robots2010

著者名/発表者名

雑誌名

[雑誌論文] Voice awareness control for a humanoid robot consistent with its body posture and movements2010

著者名/発表者名

雑誌名

[雑誌論文] A Modeling of Singing Voice Robust to Accompaniment Sounds and Its Application to Singer Identification and Vocal-Timbre-Similarity-Based Music Information2010

著者名/発表者名

雑誌名

[雑誌論文] Design and Implementation of Robot Audition System "HARK"2010

著者名/発表者名

雑誌名

[雑誌論文] ロポット聴覚の現状と課題2010

著者名/発表者名

雑誌名

[雑誌論文] ロボット聴覚オープンソフトウエアHARK2010

著者名/発表者名

雑誌名

[雑誌論文] Binaural Active Audition for Humanoid Robots to Localize Speech over Entire Azimuth Range2009

著者名/発表者名

雑誌名

[雑誌論文] Target Speech Detection and Separation for Communication with Humanoid Robots in Noisy Home Environments2009

著者名/発表者名

雑誌名

[雑誌論文] Seif-Organization of Dynamic Object Features based on Bi-Directional Training2009

著者名/発表者名

雑誌名

[雑誌論文] 音楽ロボットのための実時間音楽情報処理2009

著者名/発表者名

雑誌名

[雑誌論文] Visualization-based Approaches to Support Context Sharing towards Public Involment Support System2009

著者名/発表者名

雑誌名

[学会発表] MUSIC DEREVERBERATION USING HARMONIC STRUCTURE SOURCE MODEL AND WIENER FILTER2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 複数自由度を用いて音高特性モデルに基づく音高制御を行うテルミン演奏ロボットの開発2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] スペクトル推定を用いたマイク数以上の同時発話に対する音声認識2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 環境音から擬音語への自動変換における特徴量抽出法の検討2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] クラシック音楽理解能力拡張インターフェイスのための同音旋律音量推定手法と主旋律推定への応用2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 調波非調波GMMに基づくMIDI演奏音響信号に対する音色・演奏表情操作2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Robot Musical Accompaniment : Real-time Synchronization using Visual Cue Recognition2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 実環境音声認識のためのロボット聴覚システム開発とパラメータチューニング2010

著者名/発表者名

学会等名

発表場所

2009 年度実績報告書

奥乃博京都大学, 情報学研究科, 教授 (60318201)