2006 年度実績報告書

音響信号記号変換に基づいたセマンティックインタラクション

研究課題

研究課題/領域番号	18049048
研究機関	京都大学
研究代表者	奥乃博京都大学, 情報学研究科, 教授 (60318201)
研究分担者	駒谷和範京都大学, 情報学研究科, 助手 (40362579)
キーワード	ロボット聴覚 / 音環境理解 / 視聴覚情報統合 / 音楽情報処理 / 市販CD音楽音響信号 / ミッシングフィーチャ理論 / マスク自動生成 / 遺伝的アルゴリズム
研究概要	情報爆発という特定領域テーマに対して、音情報、すなわち、i-explosion_soundという観点から、 (1)あまり使用されていない音響信号(単音音声に加えて、混合音声や音楽や環境音から音情報を取得することによる情報爆発の促進、 (2)ディジタル音響信号処理による爆発する音情報から質的複雑化の軽減、という2つの側面について取り組んだ。主な研究項目は以下の通りである。 (1)混合音の認識:「三話者同時発話認識の高性能化・高速化」これまで開発してきたシステムは,音源定位(steered beamforer)、音源分離(GSS,ICA)、ミッシングマスク生成、ミッシングフィーチャ理論による音声認識から構成されており、三話者が同時に発話した後、分離・認識して、応答するまでに約8秒かかっていた。これに対して、RASP-2信号処理装置を使用したシステム再構成、Flow Designerによるシステム内のモジュールインタフェースの統一、および、GAによる多数のシステムパラメータのチューニングを行い、認識応答速度の高速化(1.9秒と約4倍の高速化)、および,認識率の向上が達成できた。 (2)実環境への対応と実時間処理: 上記の三話者同時発話認識では、マルチメディア実験室(5m*7m)で実際の人を用いて実験が行えるレベルまで性能が向上した。また、混合音声だけでなく、ドラム音を含むポリフォニー音楽音響信号に対しても、ドラムパターンを認識し、実時間でドラム音を編集できるオーディオプレイヤーを開発した。これにより、ロボットが音楽からビートを聴き分け、トラックできるシステムの基礎技術を確立することができた。

研究成果
(24件)

すべて 2007 2006

すべて雑誌論文 (21件) 図書 (2件) 産業財産権 (1件)

[雑誌論文] Robust Recognition of Simultaneous Speech By a Mobile Robot2007
- 著者名/発表者名
  Jean-Marc Valin
- 雑誌名
  
  IEEE Transactions on Robotics (採録決定済)
[雑誌論文] マルチドメイン音声対話システムにおける対話履歴を利用したドメイン選択2007
- 著者名/発表者名
  神田直之
- 雑誌名
  
  情報処理学会論文誌 48・5(印刷中)
[雑誌論文] Drumix : An Audio Player with Functions of Realtime Drum-Part Rearrangement for Active Music Listening2007
- 著者名/発表者名
  Kazuyoshi Yoshii
- 雑誌名
  
  Journal of Information Proceeding Society of Japan 48・3
  
  ページ: 1229-1239
[雑誌論文] Instrogram : Probabilistic Representation of Instrument Existence for Polyphonic Music2007
- 著者名/発表者名
  Tetsuro Kitahara
- 雑誌名
  
  Journal of Information Proceeding Society of Japan 48・1
  
  ページ: 214-226
[雑誌論文] 音源分離との統合によるミッシングフィーチャマスク自動生成に基づく同時発話音声認識2007
- 著者名/発表者名
  山本俊一
- 雑誌名
  
  日本ロボット学会誌 25・1
  
  ページ: 92-102
[雑誌論文] Drum Sound Recognition for Polyphonic Audio Signals by Adaptation and Matching of Spectral Templates with2007
- 著者名/発表者名
  Kazuyoshi Yoshi
- 雑誌名
  
  IEEE Transactions on Audio, Speech and Language Processing 15・1
  
  ページ: 333-345
[雑誌論文] Instrument Identification in Polyphonic Music : Feature Weighting to Minimize Influence of Sound Overlaps2007
- 著者名/発表者名
  Tetsuro Kitahara
- 雑誌名
  
  EURASIP Journal on Applied Signal Processing 2007
  
  ページ: 1-15
[雑誌論文] ミッシングフィーチャ理論に基づく音声認識を利用した複数話者同時発話認識2007
- 著者名/発表者名
  山本俊一
- 雑誌名
  
  計測と制御 46・6(採録決定済)
[雑誌論文] 音環境理解から観たロボット聴覚2007
- 著者名/発表者名
  奥乃博
- 雑誌名
  
  日本音響学会誌 63・1
  
  ページ: 29-34
[雑誌論文] Meaning-Game-based Centering Model with Statistical Definition of Utility of Referential Expression and Its Verification2007
- 著者名/発表者名
  Shun Shiramatsu
- 雑誌名
  
  Proceedings of DAARC 2007 1
  
  ページ: 121-126
[雑誌論文] Computational Auditory Scene Analysis and Its Application to Robot Audition : Five Years Experience2007
- 著者名/発表者名
  Hiroshi G. Okuno
- 雑誌名
  
  Proceedings of ICKS 2007 1
  
  ページ: 69-76
[雑誌論文] 多重奏を対象とした音源同定 : 混合音テンプレートを用いた音の重なりに頑健な特徴量への重みづけおよび音楽的文脈の利用2006
- 著者名/発表者名
  北原鉄朗
- 雑誌名
  
  電子情報通信学会論文誌 J89-D・12
  
  ページ: 2721-2733
[雑誌論文] Musical Instrument Recognizer "Instrogram" and Its Application to Music Retrieval based on Instrumentation2006
- 著者名/発表者名
  Tetsuro Kitahara
- 雑誌名
  
  Proceedins of IEEE ISM 2006 1
  
  ページ: 265-272
[雑誌論文] Automatic synchronization between lyrics and music CD recordings based on Viterbi alignment of segregated vocal2006
- 著者名/発表者名
  Hiromasa Fujihara
- 雑誌名
  
  Proceedins of IEEE ISM 2006 1
  
  ページ: 257-264
[雑誌論文] Missing-Feature based Speech Recognition for Two Simultaneous Speech Signals Separated by ICA with a pair of Humanoid Ears2006
- 著者名/発表者名
  Ryu Takeda
- 雑誌名
  
  Proceedings of IROS-2006 1
  
  ページ: 878-885
[雑誌論文] Real-Time Robot Audition System That Recognizes Simultaneous Speech in the Real World2006
- 著者名/発表者名
  Shun'ichi Yamamoto
- 雑誌名
  
  Proceedings of IROS-2006 4
  
  ページ: 5333-5338
[雑誌論文] Real-Time Tracking of Multiple Sound Sources by Integration of In-Room and Robot-Embedded Microphone Arrays2006
- 著者名/発表者名
  Kazuhiro Nakadai
- 雑誌名
  
  Proceedings of IROS-2006 1
  
  ページ: 852-859
[雑誌論文] Speaker Identification under Noisy Environments by using Harmonic Structure Extraction and Reliable Frame Weighting2006
- 著者名/発表者名
  Hiromasa Fujihara
- 雑誌名
  
  Proceedings of Interspeech-2006 2
  
  ページ: 1459-1462
[雑誌論文] Improving Speech Recognition of Two Simultaneous Speech Signals by Integrating ICA BSS and Automatic Missing Feature2006
- 著者名/発表者名
  Ryu Takeda
- 雑誌名
  
  Proceedings of Interspeech-2006 3
  
  ページ: 2302-2305
[雑誌論文] Dynamic Help Generation by Estimating User's Mental Model in Spoken Dialogue Systems2006
- 著者名/発表者名
  Yuichiro Fukubayashi
- 雑誌名
  
  Proceedings of Interspeech-2006 2
  
  ページ: 1946-1949
[雑誌論文] Multi-Domain Spoken Dialogue System with Extensibility and Robustness against Speech Recognition Errors2006
- 著者名/発表者名
  Kazunori Komatani
- 雑誌名
  
  Proceedings of SIGdial Workshop on Discourse and Dialogue 1
  
  ページ: 9-17
[図書] New Trends in Applied Intelligent Systems, LNCS 45702007
- 著者名/発表者名
  Hyun-Don Kim
- 出版者
  Springer Verlag(印刷中)
[図書] New Trends in Applied Intelligent Systems, LNCS 45702007
- 著者名/発表者名
  Ryu Takeda
- 出版者
  Springer Verlag(印刷中)
[産業財産権] 文単位検索方法,文単位検索装置,コンピュータプログラム,記憶媒体,及び文書記憶装置2006
- 発明者名
  白松俊
- 権利者名
  京都大学
- 産業財産権番号
  特願2006-224563号
- 出願年月日
  2006-08-21

2006 年度 実績報告書

音響信号記号変換に基づいたセマンティックインタラクション

研究代表者

奥乃 博 京都大学, 情報学研究科, 教授 (60318201)

研究成果

[雑誌論文] Robust Recognition of Simultaneous Speech By a Mobile Robot2007

著者名/発表者名

雑誌名

[雑誌論文] マルチドメイン音声対話システムにおける対話履歴を利用したドメイン選択2007

著者名/発表者名

雑誌名

[雑誌論文] Drumix : An Audio Player with Functions of Realtime Drum-Part Rearrangement for Active Music Listening2007

著者名/発表者名

雑誌名

[雑誌論文] Instrogram : Probabilistic Representation of Instrument Existence for Polyphonic Music2007

著者名/発表者名

雑誌名

[雑誌論文] 音源分離との統合によるミッシングフィーチャマスク自動生成に基づく同時発話音声認識2007

著者名/発表者名

雑誌名

[雑誌論文] Drum Sound Recognition for Polyphonic Audio Signals by Adaptation and Matching of Spectral Templates with2007

著者名/発表者名

雑誌名

[雑誌論文] Instrument Identification in Polyphonic Music : Feature Weighting to Minimize Influence of Sound Overlaps2007

著者名/発表者名

雑誌名

[雑誌論文] ミッシングフィーチャ理論に基づく音声認識を利用した複数話者同時発話認識2007

著者名/発表者名

雑誌名

[雑誌論文] 音環境理解から観たロボット聴覚2007

著者名/発表者名

雑誌名

[雑誌論文] Meaning-Game-based Centering Model with Statistical Definition of Utility of Referential Expression and Its Verification2007

著者名/発表者名

雑誌名

[雑誌論文] Computational Auditory Scene Analysis and Its Application to Robot Audition : Five Years Experience2007

著者名/発表者名

雑誌名

[雑誌論文] 多重奏を対象とした音源同定 : 混合音テンプレートを用いた音の重なりに頑健な特徴量への重みづけおよび音楽的文脈の利用2006

著者名/発表者名

雑誌名

[雑誌論文] Musical Instrument Recognizer "Instrogram" and Its Application to Music Retrieval based on Instrumentation2006

著者名/発表者名

雑誌名

[雑誌論文] Automatic synchronization between lyrics and music CD recordings based on Viterbi alignment of segregated vocal2006

著者名/発表者名

雑誌名

[雑誌論文] Missing-Feature based Speech Recognition for Two Simultaneous Speech Signals Separated by ICA with a pair of Humanoid Ears2006

著者名/発表者名

雑誌名

[雑誌論文] Real-Time Robot Audition System That Recognizes Simultaneous Speech in the Real World2006

著者名/発表者名

雑誌名

[雑誌論文] Real-Time Tracking of Multiple Sound Sources by Integration of In-Room and Robot-Embedded Microphone Arrays2006

著者名/発表者名

雑誌名

[雑誌論文] Speaker Identification under Noisy Environments by using Harmonic Structure Extraction and Reliable Frame Weighting2006

著者名/発表者名

雑誌名

[雑誌論文] Improving Speech Recognition of Two Simultaneous Speech Signals by Integrating ICA BSS and Automatic Missing Feature2006

著者名/発表者名

雑誌名

[雑誌論文] Dynamic Help Generation by Estimating User's Mental Model in Spoken Dialogue Systems2006

著者名/発表者名

雑誌名

[雑誌論文] Multi-Domain Spoken Dialogue System with Extensibility and Robustness against Speech Recognition Errors2006

著者名/発表者名

雑誌名

[図書] New Trends in Applied Intelligent Systems, LNCS 45702007

著者名/発表者名

出版者

[図書] New Trends in Applied Intelligent Systems, LNCS 45702007

著者名/発表者名

出版者

[産業財産権] 文単位検索方法,文単位検索装置,コンピュータプログラム,記憶媒体,及び文書記憶装置2006

発明者名

権利者名

産業財産権番号

出願年月日

2006 年度実績報告書

奥乃博京都大学, 情報学研究科, 教授 (60318201)