音響信号記号変換に基づいたセマンティックインタラクション

Research Project

Project/Area Number	18049048
Research Category	Grant-in-Aid for Scientific Research on Priority Areas
Allocation Type	Single-year Grants
Review Section	Science and Engineering
Research Institution	Kyoto University
Principal Investigator	奥乃博京都大学, 情報学研究科, 教授 (60318201)
Co-Investigator(Kenkyū-buntansha)	駒谷和範京都大学, 情報学研究科, 助手 (40362579)
Project Period (FY)	2006
Project Status	Completed (Fiscal Year 2006)
Budget Amount *help	¥6,500,000 (Direct Cost: ¥6,500,000) Fiscal Year 2006: ¥6,500,000 (Direct Cost: ¥6,500,000)
Keywords	ロボット聴覚 / 音環境理解 / 視聴覚情報統合 / 音楽情報処理 / 市販CD音楽音響信号 / ミッシングフィーチャ理論 / マスク自動生成 / 遺伝的アルゴリズム
Research Abstract	情報爆発という特定領域テーマに対して、音情報、すなわち、i-explosion_soundという観点から、 (1)あまり使用されていない音響信号(単音音声に加えて、混合音声や音楽や環境音から音情報を取得することによる情報爆発の促進、 (2)ディジタル音響信号処理による爆発する音情報から質的複雑化の軽減、という2つの側面について取り組んだ。主な研究項目は以下の通りである。 (1)混合音の認識:「三話者同時発話認識の高性能化・高速化」これまで開発してきたシステムは,音源定位(steered beamforer)、音源分離(GSS,ICA)、ミッシングマスク生成、ミッシングフィーチャ理論による音声認識から構成されており、三話者が同時に発話した後、分離・認識して、応答するまでに約8秒かかっていた。これに対して、RASP-2信号処理装置を使用したシステム再構成、Flow Designerによるシステム内のモジュールインタフェースの統一、および、GAによる多数のシステムパラメータのチューニングを行い、認識応答速度の高速化(1.9秒と約4倍の高速化)、および,認識率の向上が達成できた。 (2)実環境への対応と実時間処理: 上記の三話者同時発話認識では、マルチメディア実験室(5m*7m)で実際の人を用いて実験が行えるレベルまで性能が向上した。また、混合音声だけでなく、ドラム音を含むポリフォニー音楽音響信号に対しても、ドラムパターンを認識し、実時間でドラム音を編集できるオーディオプレイヤーを開発した。これにより、ロボットが音楽からビートを聴き分け、トラックできるシステムの基礎技術を確立することができた。

Report

(1 results)

2006 Annual Research Report

Research Products
(24 results)

All 2007 2006

All Journal Article (21 results) Book (2 results) Patent(Industrial Property Rights) (1 results)

[Journal Article] Robust Recognition of Simultaneous Speech By a Mobile Robot2007
- Author(s)
  Jean-Marc Valin
- Journal Title
  
  IEEE Transactions on Robotics (採録決定済)
- Related Report
  2006 Annual Research Report
[Journal Article] マルチドメイン音声対話システムにおける対話履歴を利用したドメイン選択2007
- Author(s)
  神田直之
- Journal Title
  
  情報処理学会論文誌 48・5(印刷中)
- Related Report
  2006 Annual Research Report
[Journal Article] Drumix : An Audio Player with Functions of Realtime Drum-Part Rearrangement for Active Music Listening2007
- Author(s)
  Kazuyoshi Yoshii
- Journal Title
  
  Journal of Information Proceeding Society of Japan 48・3
  
  Pages: 1229-1239
- Related Report
  2006 Annual Research Report
[Journal Article] Instrogram : Probabilistic Representation of Instrument Existence for Polyphonic Music2007
- Author(s)
  Tetsuro Kitahara
- Journal Title
  
  Journal of Information Proceeding Society of Japan 48・1
  
  Pages: 214-226
- Related Report
  2006 Annual Research Report
[Journal Article] 音源分離との統合によるミッシングフィーチャマスク自動生成に基づく同時発話音声認識2007
- Author(s)
  山本俊一
- Journal Title
  
  日本ロボット学会誌 25・1
  
  Pages: 92-102
- Related Report
  2006 Annual Research Report
[Journal Article] Drum Sound Recognition for Polyphonic Audio Signals by Adaptation and Matching of Spectral Templates with2007
- Author(s)
  Kazuyoshi Yoshi
- Journal Title
  
  IEEE Transactions on Audio, Speech and Language Processing 15・1
  
  Pages: 333-345
- Related Report
  2006 Annual Research Report
[Journal Article] Instrument Identification in Polyphonic Music : Feature Weighting to Minimize Influence of Sound Overlaps2007
- Author(s)
  Tetsuro Kitahara
- Journal Title
  
  EURASIP Journal on Applied Signal Processing 2007
  
  Pages: 1-15
- Related Report
  2006 Annual Research Report
[Journal Article] ミッシングフィーチャ理論に基づく音声認識を利用した複数話者同時発話認識2007
- Author(s)
  山本俊一
- Journal Title
  
  計測と制御 46・6(採録決定済)
- Related Report
  2006 Annual Research Report
[Journal Article] 音環境理解から観たロボット聴覚2007
- Author(s)
  奥乃博
- Journal Title
  
  日本音響学会誌 63・1
  
  Pages: 29-34
- Related Report
  2006 Annual Research Report
[Journal Article] Meaning-Game-based Centering Model with Statistical Definition of Utility of Referential Expression and Its Verification2007
- Author(s)
  Shun Shiramatsu
- Journal Title
  
  Proceedings of DAARC 2007 1
  
  Pages: 121-126
- Related Report
  2006 Annual Research Report
[Journal Article] Computational Auditory Scene Analysis and Its Application to Robot Audition : Five Years Experience2007
- Author(s)
  Hiroshi G. Okuno
- Journal Title
  
  Proceedings of ICKS 2007 1
  
  Pages: 69-76
- Related Report
  2006 Annual Research Report
[Journal Article] 多重奏を対象とした音源同定 : 混合音テンプレートを用いた音の重なりに頑健な特徴量への重みづけおよび音楽的文脈の利用2006
- Author(s)
  北原鉄朗
- Journal Title
  
  電子情報通信学会論文誌 J89-D・12
  
  Pages: 2721-2733
- Related Report
  2006 Annual Research Report
[Journal Article] Musical Instrument Recognizer "Instrogram" and Its Application to Music Retrieval based on Instrumentation2006
- Author(s)
  Tetsuro Kitahara
- Journal Title
  
  Proceedins of IEEE ISM 2006 1
  
  Pages: 265-272
- Related Report
  2006 Annual Research Report
[Journal Article] Automatic synchronization between lyrics and music CD recordings based on Viterbi alignment of segregated vocal2006
- Author(s)
  Hiromasa Fujihara
- Journal Title
  
  Proceedins of IEEE ISM 2006 1
  
  Pages: 257-264
- Related Report
  2006 Annual Research Report
[Journal Article] Missing-Feature based Speech Recognition for Two Simultaneous Speech Signals Separated by ICA with a pair of Humanoid Ears2006
- Author(s)
  Ryu Takeda
- Journal Title
  
  Proceedings of IROS-2006 1
  
  Pages: 878-885
- Related Report
  2006 Annual Research Report
[Journal Article] Real-Time Robot Audition System That Recognizes Simultaneous Speech in the Real World2006
- Author(s)
  Shun'ichi Yamamoto
- Journal Title
  
  Proceedings of IROS-2006 4
  
  Pages: 5333-5338
- Related Report
  2006 Annual Research Report
[Journal Article] Real-Time Tracking of Multiple Sound Sources by Integration of In-Room and Robot-Embedded Microphone Arrays2006
- Author(s)
  Kazuhiro Nakadai
- Journal Title
  
  Proceedings of IROS-2006 1
  
  Pages: 852-859
- Related Report
  2006 Annual Research Report
[Journal Article] Speaker Identification under Noisy Environments by using Harmonic Structure Extraction and Reliable Frame Weighting2006
- Author(s)
  Hiromasa Fujihara
- Journal Title
  
  Proceedings of Interspeech-2006 2
  
  Pages: 1459-1462
- Related Report
  2006 Annual Research Report
[Journal Article] Improving Speech Recognition of Two Simultaneous Speech Signals by Integrating ICA BSS and Automatic Missing Feature2006
- Author(s)
  Ryu Takeda
- Journal Title
  
  Proceedings of Interspeech-2006 3
  
  Pages: 2302-2305
- Related Report
  2006 Annual Research Report
[Journal Article] Dynamic Help Generation by Estimating User's Mental Model in Spoken Dialogue Systems2006
- Author(s)
  Yuichiro Fukubayashi
- Journal Title
  
  Proceedings of Interspeech-2006 2
  
  Pages: 1946-1949
- Related Report
  2006 Annual Research Report
[Journal Article] Multi-Domain Spoken Dialogue System with Extensibility and Robustness against Speech Recognition Errors2006
- Author(s)
  Kazunori Komatani
- Journal Title
  
  Proceedings of SIGdial Workshop on Discourse and Dialogue 1
  
  Pages: 9-17
- Related Report
  2006 Annual Research Report
[Book] New Trends in Applied Intelligent Systems, LNCS 45702007
- Author(s)
  Hyun-Don Kim
- Publisher
  Springer Verlag(印刷中)
- Related Report
  2006 Annual Research Report
[Book] New Trends in Applied Intelligent Systems, LNCS 45702007
- Author(s)
  Ryu Takeda
- Publisher
  Springer Verlag(印刷中)
- Related Report
  2006 Annual Research Report
[Patent(Industrial Property Rights)] 文単位検索方法,文単位検索装置,コンピュータプログラム,記憶媒体,及び文書記憶装置2006
- Inventor(s)
  白松俊
- Industrial Property Rights Holder
  京都大学
- Industrial Property Number
  2006-224563
- Filing Date
  2006-08-21
- Related Report
  2006 Annual Research Report

音響信号記号変換に基づいたセマンティックインタラクション

Principal Investigator

奥乃 博 京都大学, 情報学研究科, 教授 (60318201)

¥6,500,000 (Direct Cost: ¥6,500,000)

Report

Research Products

[Journal Article] Robust Recognition of Simultaneous Speech By a Mobile Robot2007

Author(s)

Journal Title

Related Report

[Journal Article] マルチドメイン音声対話システムにおける対話履歴を利用したドメイン選択2007

Author(s)

Journal Title

Related Report

[Journal Article] Drumix : An Audio Player with Functions of Realtime Drum-Part Rearrangement for Active Music Listening2007

Author(s)

Journal Title

Related Report

[Journal Article] Instrogram : Probabilistic Representation of Instrument Existence for Polyphonic Music2007

Author(s)

Journal Title

Related Report

[Journal Article] 音源分離との統合によるミッシングフィーチャマスク自動生成に基づく同時発話音声認識2007

Author(s)

Journal Title

Related Report

[Journal Article] Drum Sound Recognition for Polyphonic Audio Signals by Adaptation and Matching of Spectral Templates with2007

Author(s)

Journal Title

Related Report

[Journal Article] Instrument Identification in Polyphonic Music : Feature Weighting to Minimize Influence of Sound Overlaps2007

Author(s)

Journal Title

Related Report

[Journal Article] ミッシングフィーチャ理論に基づく音声認識を利用した複数話者同時発話認識2007

Author(s)

Journal Title

Related Report

[Journal Article] 音環境理解から観たロボット聴覚2007

Author(s)

Journal Title

Related Report

[Journal Article] Meaning-Game-based Centering Model with Statistical Definition of Utility of Referential Expression and Its Verification2007

Author(s)

Journal Title

Related Report

[Journal Article] Computational Auditory Scene Analysis and Its Application to Robot Audition : Five Years Experience2007

Author(s)

Journal Title

Related Report

[Journal Article] 多重奏を対象とした音源同定 : 混合音テンプレートを用いた音の重なりに頑健な特徴量への重みづけおよび音楽的文脈の利用2006

Author(s)

Journal Title

Related Report

[Journal Article] Musical Instrument Recognizer "Instrogram" and Its Application to Music Retrieval based on Instrumentation2006

Author(s)

Journal Title

Related Report

[Journal Article] Automatic synchronization between lyrics and music CD recordings based on Viterbi alignment of segregated vocal2006

Author(s)

Journal Title

Related Report

[Journal Article] Missing-Feature based Speech Recognition for Two Simultaneous Speech Signals Separated by ICA with a pair of Humanoid Ears2006

Author(s)

Journal Title

Related Report

[Journal Article] Real-Time Robot Audition System That Recognizes Simultaneous Speech in the Real World2006

Author(s)

Journal Title

Related Report

[Journal Article] Real-Time Tracking of Multiple Sound Sources by Integration of In-Room and Robot-Embedded Microphone Arrays2006

Author(s)

Journal Title

Related Report

[Journal Article] Speaker Identification under Noisy Environments by using Harmonic Structure Extraction and Reliable Frame Weighting2006

Author(s)

Journal Title

Related Report

[Journal Article] Improving Speech Recognition of Two Simultaneous Speech Signals by Integrating ICA BSS and Automatic Missing Feature2006

Author(s)

奥乃博京都大学, 情報学研究科, 教授 (60318201)