Study on Computational Auditory Scene Analysis for Humanoids by Active Audition

Research Project

Project/Area Number	15200015
Research Category	Grant-in-Aid for Scientific Research (A)
Allocation Type	Single-year Grants
Section	一般
Research Field	Perception information processing/Intelligent robotics
Research Institution	Kyoto University
Principal Investigator	OKUNO Hiroshi Kyoto University, G.Graduate School of Informatics, Professor, 情報学研究科, 教授 (60318201)
Co-Investigator(Kenkyū-buntansha)	KAWAHARA Tatsuya Kyoto University, Academic Center for Computing and Media Studies, Professor, 学術情報メディアセンター, 教授 (00234104) SATO Satoshi Nagoya University, Graduate School of Engineering, Professor, 工学研究科, 教授 (30205918) KOMATANI Kazunori Kyoto University, Graduate School of Informatics, Assistant Professor, 情報学研究科, 助手 (40362579) WADA Toshikazu Wakayama University, Faculty of System Engineering, Professor, システム工学部, 教授 (00231035) GOTO Masataka Advanced Institute for Science and Technology, Information Processing Division, Senior Researcher, 情報処理研究部門, 主任研究員 (20357007) 宮原誠北陸先端科学技術大学院大学, 情報科学研究科, 教授 (00115122) 中臺一博 (株)ホンダ・リサーチ・インスティチュート・ジャパン, シニア・リサーチャー
Project Period (FY)	2003 – 2006
Project Status	Completed (Fiscal Year 2006)
Budget Amount *help	¥51,350,000 (Direct Cost: ¥39,500,000、Indirect Cost: ¥11,850,000) Fiscal Year 2006: ¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000) Fiscal Year 2005: ¥8,190,000 (Direct Cost: ¥6,300,000、Indirect Cost: ¥1,890,000) Fiscal Year 2004: ¥15,990,000 (Direct Cost: ¥12,300,000、Indirect Cost: ¥3,690,000) Fiscal Year 2003: ¥22,750,000 (Direct Cost: ¥17,500,000、Indirect Cost: ¥5,250,000)
Keywords	Robot Audition / Computational Auditory Scene Analysis / Audio-Visual Integration / Music Information Processing / Automatic Onomatopoeia Recognition / Missing Feature Theory / Automatic Missing Feature Mask Generation / Genetic Algorithm / ミッシングフィーチャ / 色弁別度 / ミッシングフィーチャー理論 / 自動マスク生成 / 黄忠実音再生システム / 対人距離によるインタラクション / 色ターゲット検出 / 環境音の擬音語自動認識 / 楽器音自動認識・歌手認識 / エピゾセンサー / パラメトリックスピーカ / 最近傍識別器 / 柔軟な音声対話システム
Research Abstract	Robot audition is a capability in which a humanoid can hear sounds with its own microphones (ears) mounted on its body. Since humanoids usually hear a mixture of sounds in the real world, Computational Auditory Scene Analysis (CASA) of which essential functions consist of sound source localization, separation, and recognition of separated sounds is required to realize the capability of listening to several things simultaneously, like "Shotoku-Taishi" (Prince Shotoku). We have obtained the following research results : 1) CASA functions with less prior information : The missing-feature based approach integrated sound localization (MUSIC, or steered beamformer), sound source separation (Geometrical Source Separation, or Independent Component Analysis), and automatic speech recognition (Mulit-band Julius, or CTK) by developing automatic missing feature mask generation. The whole system was implemented on the FlowDesigner architecture, so that recognizing three simultaneous speech was perform … More ed with latency of 1.9 sec. This result confirmed the validity of our approach on different humanoids including SIG2, Robovie-R2, and ASIMO. 2) Distance-based behavior selection : The interaction strategy based on the distance between the humanoid and people according to Proxemics was devised to select an appropriate interaction partner. This system implemented on SIG-2 Humanoid was demonstrated for three months at the Kyoto University Museum to confirm its effectiveness in multiple person interaction. 3) Robust face tracking was developed based on Color-target Detection Based on Nearest Neighbor Classifier to improve the performance of moving talker tracking. 4) Music information technologies for polyphonic music, including musical instrument recognition, drum sound extraction, and singer recognition, were developed for humanoids to hear music. 5) User model and error recovery from speech recognition errors were developed to improve the usability of multi-domain spoken dialogue system. 6) Automatic onomatopoeia recognition system was developed to use environmental sounds in humanoid-human interaction. Future work includes the design and development of robot audition based on CASA. Less

Report

(5 results)

2006 Annual Research Report Final Research Report Summary
2005 Annual Research Report
2004 Annual Research Report
2003 Annual Research Report

Research Products
(176 results)

All 2007 2006 2005 2004 2003 2000 Other

All Journal Article (132 results) Book (10 results) Patent(Industrial Property Rights) (8 results) Publications (26 results)

[Journal Article] マルチドメイン音声対話システムにおける対話履歴を利用したドメイン選択2007
- Author(s)
  神田直之他
- Journal Title
  
  情報処理学会論文誌 48・5
  
  Pages: 1980-1989
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Drumix : An Audio Player with Functions of Realtime Drum-Part Rearrangement for Active Music Listening2007
- Author(s)
  Kazuyoshi Yoshii, et al.
- Journal Title
  
  Journal of Information Proceeding Society of Japan 48・3
  
  Pages: 1229-1239
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Instrogram : Probabilistic Representation of Instrument Existence for Polyphonic Music2007
- Author(s)
  Tetsuro Kitahara, et al.
- Journal Title
  
  Journal of Information Proceeding Society of Japan 48・3
  
  Pages: 214-226
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] 動的リコンフィギャラブルデバイスDRPを用いたロボット聴覚のための音源分離フィルタ2007
- Author(s)
  黒瀧俊輔他
- Journal Title
  
  電子情報通信学会論文誌 J90-D・3
  
  Pages: 897-907
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] 音源分離との統合によるミッシングフィーチャマスク自動生成に基づく同時発話音声認識2007
- Author(s)
  山本俊一他
- Journal Title
  
  日本ロボット学会誌 25・1
  
  Pages: 92-102
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Drum Sound Recognition for Polyphonic Audio Signals by Adaptation and Matching of Spectral Templates with Harmonic Harmonic Structure Suppression2007
- Author(s)
  Kazuyoshi Yoshii, et al.
- Journal Title
  
  IEEE Transactions on Audio, Speech and Language Processing 15・1
  
  Pages: 333-345
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Instrument Identification in Polyphonic Music : Feature Weighting to Minimize Influence of Sound Overlaps2007
- Author(s)
  Tetsuro Kitahara, et al.
- Journal Title
  
  EURASIP Journal on Applied Signal Processing 48・5
  
  Pages: 1980-1989
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] 音環境理解から観たロボット聴覚2007
- Author(s)
  奥乃博
- Journal Title
  
  日本音響学会誌 63・1
  
  Pages: 29-34
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Annual Research Report 2006 Final Research Report Summary
[Journal Article] Robust Domain Selection Using Dialogue History in Multi-domain Spoken Dialogue Systems (in Japanese)2007
- Author(s)
  Naoyuki Kanda, Kazunori Komatani, Mikio Nakano, Kazuhiro Nakadai, Hiroshi Tsujino, Tetsuya Ogata, Hiroshi G. Okuno
- Journal Title
  
  IPSJ Journal Vol.48, No.5
  
  Pages: 1980-1989
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Drumix : An Audio Player with Functions of Realtime Drum-Part Rearrangement for Active Music Listening2007
- Author(s)
  Kazuyoshi Yoshii, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.Okuno
- Journal Title
  
  IPSJ Journal Vol.48, No.3
  
  Pages: 1229-1239
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Instrogram : Probabilistic Representation of Instrument Existence for Polyphonic Music2007
- Author(s)
  Tetsuro Kitahara, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
- Journal Title
  
  IPSJ Journal Vol.48, No.1
  
  Pages: 214-226
- NAID
  130000058329
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Sound Source Separation Filter for Robot Audition used by Dynamic Reconfigurable Device, DRP (in Japanese)2007
- Author(s)
  Shunsuke Kurotaki, Noriaki Suzuki, Kazuhiro Nakadai, Hiroshi G.Okuno, Hideharu Aamano
- Journal Title
  
  IEICE Transaction on Information and Systems Vol.J90-D, No.3
  
  Pages: 897-907
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Simultaneous Speech Recognition based on Automatic Missing-Feature Mask Generation integrated with Sound Source Separation (in Japanese)2007
- Author(s)
  Shun'ichi Yamamoto, Kazuhiro Nakadai, Mikio Nakano, Hiroshi Tsujino, Jean-Marc Valin, Kazunori Komatani, Tetsuya Ogata Hiroshi G,. Okuno
- Journal Title
  
  Journal of Robotic Society of Japan Vol.25, No.1
  
  Pages: 92-102
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Drum Sound Recognition for Polyphonic Audio Signals by Adaptation and Matching of Spectral Templates with Harmonic Harmonic Structure Suppression2007
- Author(s)
  Kazuyoshi Yoshii, Masataka Goto, Hiroshi G.Okuno
- Journal Title
  
  IEEE Transactions on Audio, Speech and Language Processing. Vol.15, No.1
  
  Pages: 333-345
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Instrument Identification in Polyphonic Music : Feature Weighting to Minimize Influence of Sound Overlaps2007
- Author(s)
  Tetsuro Kitahara, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.Okuno
- Journal Title
  
  EURASIP Journal on Applied Signal Processing, Special issue on Music Information Retrieval Based on Signal Processing Vol.2007, Article ID 51979
  
  Pages: 15-15
- NAID
  120005439183
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Robot Audition from the viewpoint of Computational Auditory Scene Analysis (in Japanese)2007
- Author(s)
  Hiroshi G.Okuno
- Journal Title
  
  Journal of Acoustic Society of Japan Vol. 63, No,1
  
  Pages: 29-34
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Bus Information System Based on User Models and Dynamic Generation of VoiceXML Scripts2007
- Author(s)
  Shinichi Ueno, Fumihiro Adachi, Kazunori Komatani, Tatsuya Kawahara, Hiroshi G.Okuno
- Journal Title
  
  New Frontiers in Artificial Intelligence (JSAI 2003/2004), LNAI 3609
  
  Pages: 45-60
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] マルチドメイン音声対話システムにおける対話履歴を利用したドメイン選択2007
- Author(s)
  神田直之
- Journal Title
  
  情報処理学会論文誌 48・5(印刷中)
- Related Report
  2006 Annual Research Report
[Journal Article] Drumix : An Audio Player with Functions of Realtime Drum-Part Rearrangement for Active Music Listening2007
- Author(s)
  Kazuyoshi Yoshii
- Journal Title
  
  Journal of Information Proceeding Society of Japan 48・3
  
  Pages: 1229-1239
- Related Report
  2006 Annual Research Report
[Journal Article] Instrogram : Probabilistic Representation of Instrument Existence for Polyphonic Music2007
- Author(s)
  Tetsuro Kitahara
- Journal Title
  
  Journal of Information Proceeding Society of Japan 48・1
  
  Pages: 214-226
- Related Report
  2006 Annual Research Report
[Journal Article] 動的リコンフィギャラブルデバイス DRP を用いたロボット聴覚のための音源分離フィルタ2007
- Author(s)
  黒瀧俊輔
- Journal Title
  
  電子情報通信学会論文誌 J90-D・3
  
  Pages: 897-907
- Related Report
  2006 Annual Research Report
[Journal Article] 音源分離との統合によるミッシングフィーチャマスク自動生成に基づく同時発話音声認識2007
- Author(s)
  山本俊一
- Journal Title
  
  日本ロボット学会誌 25・1
  
  Pages: 92-102
- Related Report
  2006 Annual Research Report
[Journal Article] Drum Sound Recognition for Polyphonic Audio Signals by Adaptation and Matching of Spectral Templates with2007
- Author(s)
  Kazuyoshi Yoshi
- Journal Title
  
  IEEE Transactions on Audio, Speech and Language Processing 15・1
  
  Pages: 333-345
- Related Report
  2006 Annual Research Report
[Journal Article] Instrument Identification in Polyphonic Music : Feature Weighting to Minimize Influence of Sound Overlaps2007
- Author(s)
  Tetsuro Kitahara
- Journal Title
  
  EURASIP Journal on Applied Signal Processing 2007
  
  Pages: 1-15
- Related Report
  2006 Annual Research Report
[Journal Article] Computational Auditory Scene Analysis and Its Application to Robot Audition : Five Years Experience2007
- Author(s)
  Hiroshi G. Okuno
- Journal Title
  
  Proceedings of ICKS 2007 1
  
  Pages: 69-76
- Related Report
  2006 Annual Research Report
[Journal Article] 多重奏を対象とした音源同定 : 混合音テンプレートを用いた音の重なりに頑健な特徴量への重みづけおよび音楽的文脈の利用2006
- Author(s)
  北原鉄朗他
- Journal Title
  
  電子情報通信学会論文誌 J89-D・12
  
  Pages: 2721-2733
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] データベース検索タスクにおける対話文脈を利用した音声言語理解2006
- Author(s)
  神田直之他
- Journal Title
  
  情報処理学会論文誌 47・6
  
  Pages: 1802-1811
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] 伴奏音抑制と高信頼度フレーム選択に基づく楽曲の歌手名同定手法2006
- Author(s)
  藤原弘将他
- Journal Title
  
  情報処理学会論文誌 47・6
  
  Pages: 1831-1843
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] 遺伝的アルゴリズムを用いたパラメータ最適化による話者位置に基づく同時発話認識の向上2006
- Author(s)
  山本俊一他
- Journal Title
  
  ヒューマンインタフェース学会論文誌 18・2
  
  Pages: 203-212
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Common Acoustical Pole Estimation from Multi-Channel Musical Audio Signals2006
- Author(s)
  Takuya Yoshioka, et al.
- Journal Title
  
  IEICE Trans. on Fundamentals of Electronics, Communications, and Computer Sciences E89-A・1
  
  Pages: 240-247
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Instrument Identification in Polyphonic Music : Feature Weighting Based on Mixed-Sound Template and Use of Musical Context (in Japanese)2006
- Author(s)
  Tetsuro Kitahara, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.Okuno
- Journal Title
  
  IEICE Transaction on, Information and Systems Vol.J89-D, No.12
  
  Pages: 2721-2733
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Spoken Language Understanding Using Dialogue Context in Database Search (in Japanese)2006
- Author(s)
  Naoyuki Kanda, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.Okuno
- Journal Title
  
  IPSJ Journal Vol.47, No.6
  
  Pages: 1802-1811
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] A Singer Identification Method for Musical Pieces on the Basis of Accompaniment Sound Reduction and Reliable Frame Selection (in Japanese)2006
- Author(s)
  Hiromasa Fujihara, Tetsuro Kitahara, Masataka Goto, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.Okuno
- Journal Title
  
  IPSJ Journal Vol.47, No.6
  
  Pages: 1831-1843
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Improving Location-Based Speech Recognition of Simultaneous Speech Signals by Parameter Optimization with Genetic Algorithm (in Japanese)2006
- Author(s)
  Shun'ichi Yamamoto, Kazuhiro Nakadai, Mikio Nakano, Hiroshi Tsujino, Ryu Takeda, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
- Journal Title
  
  Journal of Human Interface Society Vol.8, No.2
  
  Pages: 203-212
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Common Acoustical Pole Estimation from Multi-Channel Musical Audio Signals2006
- Author(s)
  Takuya Yoshioka, Takafumi Hikichi, Masato Miyoshi, Hiroshi G.Okuno
- Journal Title
  
  IEICE Trans. on Fundamentals of Electronics, Communications, and Computer Sciences Vol.E89-A, No.1
  
  Pages: 240-247
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Recognition of Simultaneous Speech by Estimating Reliability of Separated Signals for Robot Audition2006
- Author(s)
  Shun'ichi Yamamoto, Ryu Takeda, Kazuhiro Nakadai, Mikio Nakano, Hiroshi Tsujino, Jean-Marc Valin, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
- Journal Title
  
  PRICAI 2006 : Trends in Artificial Intelligence LNCS 4099
  
  Pages: 484-494
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Genetic Algorithm based Improvement of Robot's Hearing Capabilities in Separating and Recognizing Simultaneous Speech Signals2006
- Author(s)
  Shun'ichi Yamamoto, Kazuhiro Nakadai, Mikio Nakano, Hiroshi Tsujino, Jean-Marc Valin, Ryu Takeda, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
- Journal Title
  
  Advances in Applied Artificial Intelligence (IEA/AIE-2006), LNAI 4031
  
  Pages: 207-217
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] 多重奏を対象とした音源同定 : 混合音テンプレートを用いた音の重なりに頑健な特徴量への重みづけおよび音楽的文脈の利用2006
- Author(s)
  北原鉄朗
- Journal Title
  
  電子情報通信学会論文誌 J89-D・12
  
  Pages: 2721-2733
- Related Report
  2006 Annual Research Report
[Journal Article] データベース検索タスクにおける対話文脈を利用した音声言語理解2006
- Author(s)
  神田直之
- Journal Title
  
  情報処理学会論文誌 47・6
  
  Pages: 1802-1811
- Related Report
  2006 Annual Research Report
[Journal Article] 伴奏音抑制と高信頼度フレーム選択に基づく楽曲の歌手名同定手法2006
- Author(s)
  藤原弘将
- Journal Title
  
  情報処理学会論文誌 47・6
  
  Pages: 1831-1843
- Related Report
  2006 Annual Research Report
[Journal Article] 遺伝的アルゴリズムを用いたパラメータ最適化による話者位置に基づく同時発話認識の向上2006
- Author(s)
  山本俊一
- Journal Title
  
  ヒューマンインタフェース学会論文誌 18・2
  
  Pages: 203-212
- Related Report
  2006 Annual Research Report
[Journal Article] Automatic Feature Weighting in Automatic Transcription of Specified Part in Pnlyphonic Music2006
- Author(s)
  Katsutoshi Itoyama
- Journal Title
  
  Proceedings of ISMIR-2006 1
  
  Pages: 172-175
- Related Report
  2006 Annual Research Report
[Journal Article] Missing-Feature based Speech Recognition for Two Simultaneous Speech Signals Separated by ICA with a pair of Humanoid Ears2006
- Author(s)
  Ryu Takeda
- Journal Title
  
  Proceedings of IROS-2006 1
  
  Pages: 878-885
- Related Report
  2006 Annual Research Report
[Journal Article] Real-Time Robot Audition System That Recognizes Simultaneous Speech in the Real World2006
- Author(s)
  Shun'ichi Yamamoto
- Journal Title
  
  Proceedings of IROS-2006 4
  
  Pages: 5333-5338
- Related Report
  2006 Annual Research Report
[Journal Article] Multi-Domain Spoken Dialogue System with Extensibility and Robustness against Speech Recognition Errors2006
- Author(s)
  Kazunori Komatani
- Journal Title
  
  Proceedings of SIGdial Workshop on Discourse and Dialogue 1
  
  Pages: 9-17
- Related Report
  2006 Annual Research Report
[Journal Article] Dynamic Help Generation by Estimating User's Mental Model in Spoken Dialogue Systems2006
- Author(s)
  Yuichiro Fukubayashi
- Journal Title
  
  Proceedings of Interspeech-2006 2
  
  Pages: 1946-1949
- Related Report
  2006 Annual Research Report
[Journal Article] AN ERROR CORRECTION FRAMEWORK BASED ON DRUM PATTERN PERIODICITY FOR IMPROVING DRUM SOUND DETECTION2006
- Author(s)
  Kazuyoshi Yoshii
- Journal Title
  
  Proceedings of ICASSP-2006 V
  
  Pages: 237-240
- Related Report
  2006 Annual Research Report
[Journal Article] ROBUST TRACKING OF MULTIPLE SOUND SOURCES BY SPATIAL INTEGRATION OF ROOM AND ROBOT MICROPHONE ARRAYS2006
- Author(s)
  Kazuhiro Nakadai
- Journal Title
  
  Proceedings of ICASSP-2006 IV
  
  Pages: 929-932
- Related Report
  2006 Annual Research Report
[Journal Article] Using Multiple Edit Distances to Automatically Grade Outputs from Machine Translation Systems,2006
- Author(s)
  Yasuhiro Akiba
- Journal Title
  
  IEEE Transactions on Audio, Speech and Language Processing 14・2
  
  Pages: 393-402
- Related Report
  2005 Annual Research Report
[Journal Article] Common Acoustical Pole Estimation from Multi-Channel Musical Audio Signals2006
- Author(s)
  Takuya Yoshioka
- Journal Title
  
  EICE Trans.on Fundamentals of Electronics, Communications, and Computer Sciences E89-A・1
  
  Pages: 240-247
- Related Report
  2005 Annual Research Report
[Journal Article] Drumix:ドラムパートのリアルタイム編集機能付きオーディオプレイヤー2006
- Author(s)
  吉井和佳
- Journal Title
  
  インタラクション2006
  
  Pages: 207-208
- Related Report
  2005 Annual Research Report
[Journal Article] Pitch-dependent identification of musical instrument sounds2005
- Author(s)
  Tetsuro Kitahara, et al.
- Journal Title
  
  Applied Intelligence 23・3
  
  Pages: 267-275
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] 非線形振動子による引き込みを利用した仮想空間における歩行2005
- Author(s)
  小鷹研理他
- Journal Title
  
  ヒューマンインタフェース学会論文誌 17・4
  
  Pages: 26-36
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] ミッシングフィーチャ理論を利用した音源分離と音声認識のインターフェースと複数ロボットヘの適用2005
- Author(s)
  山本俊一他
- Journal Title
  
  日本ロボット学会誌 23・6
  
  Pages: 743-751
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] ゲーム理論による中心化理論の解体と実言語データに基づく検証2005
- Author(s)
  白松俊他
- Journal Title
  
  自然言語処理 12・3
  
  Pages: 91-110
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] User Modeling in Spoken Dialogue Systems to Generate Flexible Guidance2005
- Author(s)
  Kazunori Komatani, et al.
- Journal Title
  
  User Modeling and User-Adapted Interaction 15・1-2
  
  Pages: 169-183
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Dynamic Communication of Humanoid Robot with Multiple People Based on Interaction Distance2005
- Author(s)
  Tsuyosni Tasaki, ei al
- Journal Title
  
  人工知能学会論文誌 20・3
  
  Pages: 209-219
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Pitch-dependent identification of musical instrument sounds2005
- Author(s)
  Tetsuro Kitahara, Masataka Goto, Hiroshi G.Okuno
- Journal Title
  
  Applied Intelligence Vol.23, No.3
  
  Pages: 267-275
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Walking in Virtual Space with Entrainment Based on a Nonlinear Oscillator (in Japanese)2005
- Author(s)
  Kenri Kodaka, Tetsuya Ogata, Hiroshi G.Okuno
- Journal Title
  
  Journal of Human Interface Society Vol.7, No.4
  
  Pages: 26-36
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Missing Feature Theory Based Interface Between Sound Source Separation and Automatic Speech Recognition and Applying to Multiple Robots (in Japanese)2005
- Author(s)
  Shunichi Yamamoto, Kazuhiro Nakadai, Hiroshi Tsujino, Hiroshi G. Okuno
- Journal Title
  
  Journal of Robotic Society of Japan Vol.23, No.6
  
  Pages: 743-751
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Dissolution of Centering Theory Based on Game Theory and Its Empirical Verification (in Japanese)2005
- Author(s)
  Shun Shiramatsu, Takashi Miyata, Hiroshi G.Okuno, Koiti Hasida
- Journal Title
  
  Natural Language Processing Vol.12, No.3
  
  Pages: 91-110
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] User Modeling in Spoken Dialogue Systems to Generate Flexible Guidance2005
- Author(s)
  Kazunori Komatani, Shinichi Ueno, Tatsuya Kawahara, Hiroshi G. Okuno
- Journal Title
  
  User Modeling and User-Adapted Interaction Vol.15, No.1-2
  
  Pages: 169-183
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Dynamic Communication of Humanoid Robot with Multiple People Based on Interaction Distance2005
- Author(s)
  Tsuyoshi Tasaki, Shohei Matsumoto, Hayato Ohba, Shun'ichi Yamamoto, Mitsuhiko Toda, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
- Journal Title
  
  Transactions of the Japanese Society for Artificial Intelligence Vol.20, No.3
  
  Pages: 209-219
- NAID
  120005439187
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Automatic Recognition of Onomatopoeia for Environmental Sounds, (in Japanese)2005
- Author(s)
  Kazushi Ishihara, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.Okuno
- Journal Title
  
  Transactions of the Japanese Society for Artificial Intelligence Vol.20, No.3
  
  Pages: 229-236
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Distance Based Dynamic Interaction of Humanoid Robot with Multiple People2005
- Author(s)
  Tsuyoshi Tasaki, Shohei Matsumoto, Hayato Ohba, Mitsuhiko Toda, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.Okuno
- Journal Title
  
  Innovations in Applied Artificial Intelligence (IEA/AIE-2005) LNAI 3533
  
  Pages: 111-120
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Extracting Multi-Modal Dynamics of Objects using RNNPB2005
- Author(s)
  Tetsuya Ogata
- Journal Title
  
  Journal of Robotics and Mechatronics 17・6
  
  Pages: 681-688
- Related Report
  2005 Annual Research Report
[Journal Article] Pitch-dependent identification of musical instrument sounds2005
- Author(s)
  Tetsuro Kitahara
- Journal Title
  
  Applied Intelligence 23・3
  
  Pages: 267-275
- Related Report
  2005 Annual Research Report
[Journal Article] 非線形振動子による引き込みを利用した仮想空間における歩行2005
- Author(s)
  小鷹研理
- Journal Title
  
  ヒューマンインタフェース学会論文誌 17・4
  
  Pages: 26-36
- Related Report
  2005 Annual Research Report
[Journal Article] ミッシングフィーチャ理論を利用した音源分離と音声認識のイターフエースと複数ロボットへの適用2005
- Author(s)
  山本俊一
- Journal Title
  
  日本ロボット学会誌 23・6
  
  Pages: 743-751
- Related Report
  2005 Annual Research Report
[Journal Article] ゲーム理論による中心化理論の解体と実言語データに基づく検証2005
- Author(s)
  白松俊
- Journal Title
  
  自然言語処理 12・3
  
  Pages: 91-110
- Related Report
  2005 Annual Research Report
[Journal Article] Distance Based Dynamic Interaction of Humanoid Robot with Multiple People2005
- Author(s)
  Tsuyoshi Tasaki
- Journal Title
  
  Lecture Notes in Artificial Intelligence 3533
  
  Pages: 111-120
- Related Report
  2005 Annual Research Report
[Journal Article] 超音波センサアレイを用いたアクティブセンシングによる3次元物体の位置・形状認識2005
- Author(s)
  奥乃博
- Journal Title
  
  超音波テクノ 2005・9-10
  
  Pages: 79-84
- Related Report
  2005 Annual Research Report
[Journal Article] Empirical Verification of Meaning-Game-based Generalization of Centering Theory with Large Japanese2005
- Author(s)
  Shun Shiramatsu
- Journal Title
  
  Proceedings of the 19th Pacific Asia Conference on Language, Information, and Computation (PACLIC 19)
  
  Pages: 192-210
- Related Report
  2005 Annual Research Report
[Journal Article] INTER : D A Drum Sound Equalizer for Controlling Volume and Timbre of Druams2005
- Author(s)
  Kazuyoshi Yoshii
- Journal Title
  
  Proceedings of 2nd European Workshop on the Integration of Knowledge, Semantic and Digital Media Technologies (EWIMT
  
  Pages: 205-212
- Related Report
  2005 Annual Research Report
[Journal Article] Walking with Body-sense in Virtual Space Using the Nonlinear Oscillator2005
- Author(s)
  Kenri Kodaka
- Journal Title
  
  Proceedings of the International Conference on Systems, Man and Cybernetics (SMC-2005)
- Related Report
  2005 Annual Research Report
[Journal Article] AdaMast : A Drum Sound Recognizer based on Adaptation and Matching of Spectrogram Templates2005
- Author(s)
  Kazuyoshi Yoshii
- Journal Title
  
  Proceedings of MIREX 2005
- Related Report
  2005 Annual Research Report
[Journal Article] SINGER IDENTIFICATION BASED ON ACCOMPANIMENT SOUND REDUCTION AND RELIABLE FRAME SELECTION2005
- Author(s)
  Hiromasa Fujihara
- Journal Title
  
  Proceedings of 6th International Conference on Musical information Retreival (ISMIR-2005)
  
  Pages: 329-336
- Related Report
  2005 Annual Research Report
[Journal Article] INSTRUMENT IDENTIFICATION IN POLYPHONIC MUSIC : FEATURE WEIGHTING WITH MIXED SOUNDS, PITCH-DEPENDENT TIMBRE2005
- Author(s)
  Tetsuro Kitahara
- Journal Title
  
  Proceedings of 6th International Conference on Musical Information Retreival (ISMIR-2005)
  
  Pages: 558-563
- Related Report
  2005 Annual Research Report
[Journal Article] Contextual Constraints based on Dialogue Models in Database Search Task for Spoken Dialogue Systems2005
- Author(s)
  Kazunori Komatani
- Journal Title
  
  Proceedings of the Nineth European Conference on Speech Communication and Technology (Interspeech-2005)
  
  Pages: 877-880
- Related Report
  2005 Annual Research Report
[Journal Article] Multiple Moving Speaker Tracking by Microphone Array on Mobile Robot2005
- Author(s)
  Masamitsu Murase
- Journal Title
  
  Proceedings of the Nineth European Conference on Speech Communication and Technology (Interspeech-2005)
  
  Pages: 249-252
- Related Report
  2005 Annual Research Report
[Journal Article] Making A Robot Recognize Three Simultaneous Sentences in Real-Time2005
- Author(s)
  Shun'ichi Yamamoto
- Journal Title
  
  Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2005)
  
  Pages: 897-892
- Related Report
  2005 Annual Research Report
[Journal Article] Implementation of Active Direction-Pass Filter on Dynamically Reconfigurable Processo2005
- Author(s)
  Syunsuke Kurotaki
- Journal Title
  
  Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2005)
  
  Pages: 515-520
- Related Report
  2005 Annual Research Report
[Journal Article] Spatially Mapping of Friendliness for Human-Robot Interaction2005
- Author(s)
  Tsuyoshi Tasaki
- Journal Title
  
  Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2005)
  
  Pages: 521-526
- Related Report
  2005 Annual Research Report
[Journal Article] Extracting Multi-Modal Dynamics of Objects using RNNPB2005
- Author(s)
  Tetsuya Ogata
- Journal Title
  
  Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2005)
  
  Pages: 160-165
- Related Report
  2005 Annual Research Report
[Journal Article] Generating Confirmation to Distinguish Phonologically Confusing Word Pairs in Spoken Dialogue Systems2005
- Author(s)
  Kazunori Komatani
- Journal Title
  
  Proceedings of 4th IJCAI Workshop on Knowledge and Reasoning in Practical Dialogue Systems
  
  Pages: 40-45
- Related Report
  2005 Annual Research Report
[Journal Article] Robot Gesture Generation from Environmental Sounds Using Inter-modality Mapping2005
- Author(s)
  Yuya Hattori
- Journal Title
  
  Proceedings of Fifth International Workshop on Epigenetic Robotics (EpiRobo-2005)
  
  Pages: 139-140
- Related Report
  2005 Annual Research Report
[Journal Article] Blind Estimation of Room Resonances Using Popular, Classical, and Jazz Music2005
- Author(s)
  Takuya Yoshioka
- Journal Title
  
  Proceedings of AES 118th Convenvion
  
  Pages: 6632-6632
- Related Report
  2005 Annual Research Report
[Journal Article] Enhanced Robot Speech Recognition Based on Microphone Array Source Separation and Missing Feature Theory2005
- Author(s)
  Shun'ichi Yamamoto
- Journal Title
  
  Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2005)
  
  Pages: 1489-1494
- Related Report
  2005 Annual Research Report
[Journal Article] 事例を用いた弁別性マップの構築とその応用2005
- Author(s)
  飯塚健男
- Journal Title
  
  情報処理学会研究報告「コンピュータビジョンとイメージメディア」 2005-CVIM-151
  
  Pages: 65-70
- Related Report
  2005 Annual Research Report
[Journal Article] A computational model of monkey cortical grating cells2005
- Author(s)
  Tino Lourens, Hiroshi G.Okuno, Hiroshi Tsujino
- Journal Title
  
  Biological Cybernetics 92・1
  
  Pages: 61-70
- Related Report
  2004 Annual Research Report
[Journal Article] 環境音を対象とした擬音語自動認識2005
- Author(s)
  石原一志, 駒谷和範, 尾形哲也, 奥乃博
- Journal Title
  
  人工知能学会論文誌 20・3
  
  Pages: 229-236
- Related Report
  2004 Annual Research Report
[Journal Article] Dynamic Communication of Humanoid Robot with Multiple People Based on Interaction Distance2005
- Author(s)
  Tsuyoshi Tasaki, Shohei Matsumoto, Hayato Ohba, Shun'ichi Yamamoto, Mitsuhiko Toda, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.Okuno
- Journal Title
  
  人工知能学会論文誌 20・3
  
  Pages: 209-219
- NAID
  120005439187
- Related Report
  2004 Annual Research Report
[Journal Article] 複数の編集距離を用いた口語翻訳文の自動評価2005
- Author(s)
  秋葉泰弘, 今村賢治, 隅田英一郎, 中岩浩巳, 山本誠一, 奥乃博
- Journal Title
  
  人工知能学会論文誌 20・3
  
  Pages: 139-148
- NAID
  10022005063
- Related Report
  2004 Annual Research Report
[Journal Article] ミッシングフィーチャ理論を利用した音源分離と音声認識のインターフェースと複数ロボットへの適用2005
- Author(s)
  山本俊一, 中臺一博, 辻野広司, 奥乃博
- Journal Title
  
  日本ロボット学会誌 23・4(印刷中)
- NAID
  10019037794
- Related Report
  2004 Annual Research Report
[Journal Article] Sound and Visual Tracking for Humanoid Robot2004
- Author(s)
  Hiroshi G.Okuno, Kazuhiro Nakadai, Tino Lourens, Hiroaki Kitano
- Journal Title
  
  Applied Intelligence 20・3
  
  Pages: 253-266
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary 2004 Annual Research Report
[Journal Article] 音声対話システムにおける適応的な応答生成を行うためのユーザモデル2004
- Author(s)
  駒谷和範, 上野晋一, 河原達也, 奥乃博
- Journal Title
  
  電子情報通信学会論文誌 87-D2・10
  
  Pages: 1921-1928
- NAID
  110003171015
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary 2004 Annual Research Report
[Journal Article] Effects of increasing modalities in recognizing three simultaneous speeches2004
- Author(s)
  Hiroshi G.Okuno, Kazuhiro Nakadai, Hiroaki Kitano
- Journal Title
  
  Speech Communication 43・4
  
  Pages: 347-359
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary 2004 Annual Research Report
[Journal Article] Improvement of Recognition of Simultaneous Speech Signals Using AV Integration and Scattering Theory for Humanoid Robots2004
- Author(s)
  Kazuhiro Nakadai, et al.
- Journal Title
  
  Speech Communication 44・1
  
  Pages: 97-112
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] 最近傍識別による背景差分と色検出の統合-事例に基く情報統合-2004
- Author(s)
  加藤丈和, 和田俊和
- Journal Title
  
  情報処理学会論文誌 : コンピュータビジョンとイメージメディア 45・SIG13 (CVIM10)
  
  Pages: 110-117
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] 音響的類似性を反映した楽器の階層表現の獲得とそれに基づく未知楽器のカテゴリーレベルの音源同定2004
- Author(s)
  北原鉄朗, 後藤真孝, 奥乃博
- Journal Title
  
  情報処理学会論文誌 45・3
  
  Pages: 680-689
- NAID
  110002712119
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] 音高による音色変化に着目した楽器音の音源同定 : F0依存多次元正規分布に基づく識別手法2004
- Author(s)
  山肩洋子, 河原達也, 奥乃博, 美濃導彦
- Journal Title
  
  人工知能学会誌 19・1F
  
  Pages: 47-56
- NAID
  110002711583
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Active audition for humanoid robots that can listen to three simultaneous talkers2004
- Author(s)
  Hiroshi G.Okuno, Kazuhiro Nakadai
- Journal Title
  
  Journal of the Acoustical Society of America 113・4
  
  Pages: 2230-2230
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Sound and Visual Tracking for Humanoid Robot2004
- Author(s)
  Hiroshi G.Okuno, Kazuhiro Nakadai, Tino Lourens, Hiroaki Kitano
- Journal Title
  
  Applied Intelligence Vol.20, No.3
  
  Pages: 253-266
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] User model for Adaptive Response Generation in Spoken Dialogue System (in Japanese)2004
- Author(s)
  Kazunori Komatani, Shinichi Ueno, Tatsuya Kawahara, Hiroshi G Okuno
- Journal Title
  
  IEICE Transactions on Information and Systems Vol.87-D2, No.10
  
  Pages: 1921-1928
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Effects of increasing modalities in recognizing three simultaneous speeches2004
- Author(s)
  Hiroshi G.Okuno, Kazuhiro Nakadai, Hiroaki Kitano
- Journal Title
  
  Speech Communication Vol.43, No.4
  
  Pages: 347-359
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Improvement of Recognition of Simultaneous Speech Signals Using AV Integration and Scattering Theory for Humanoid Robots2004
- Author(s)
  Kazuhiro Nakadai, Daisuke Matsuura, Hiroshi G.Okuno, Hiroshi Tsujino
- Journal Title
  
  Speech Communication Vol.44
  
  Pages: 97-112
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Integration between Background Subtraction and Color Detection Based on Nearest Neighbor Classifier : Instance Based Multimodal Information Integration (in Japanese)2004
- Author(s)
  Takekazu Kato, Toshikazu Wada
- Journal Title
  
  Transactions on Computer Vision and Image Media Vol.45, No.SIG13 (CVIM10)
  
  Pages: 110-117
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Acoustic-feature-based Musical Instrument Hierarchy and Its Application to Category-level Recognition of Unknown Musical Instruments (in Japanese)2004
- Author(s)
  Tetsuro Kitahara, Masataka Goto, Hiroshi G. Okuno
- Journal Title
  
  IPSJ Journal Vol.45, No.3
  
  Pages: 680-689
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Belief Network based Disambiguation of Object Reference in Spoken Dialogue System (in Japanese)2004
- Author(s)
  Yoko Yamakata, Tatsuya Kawahara, Hiroshi G.Okuno, Michihiko Minoh
- Journal Title
  
  Transactions of the Japanese Society for Artificial Intelligence Vol.19, No.1 F
  
  Pages: 47-56
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Automatic Sound-Imitation Word Recognition from Environmental Sounds focusing on Ambiguity Problem in Determining Phonemes.2004
- Author(s)
  Kazushi Ishihara, Tomohiro Nakatani, Tetsuya Ogata, Hiroshi G.Okuno
- Journal Title
  
  PRICAI 2004 : Trends in Artificial Intelligence LNAI 3157
  
  Pages: 909-918
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Recognition of Emotional States in Spoken Dialogue with a Robot.2004
- Author(s)
  Kazunori Komatani, Ryosuke Itoh, Tatsuya Kawahara, Hiroshi G.Okuno
- Journal Title
  
  Innovations in Applied Artificial Intelligence IEA/AIE-2004, LNAI 3029
  
  Pages: 413-423
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Improvement of Recognition of Simultaneous Speech Signals Using AV Integration and Scattering Theory for Humanoid Robots2004
- Author(s)
  Kazuhiro Nakadai, Daisuke Matsuura, Hiroshi G.Okuno, Hiroshi Tsujino
- Journal Title
  
  Speech Communication 44・1
  
  Pages: 97-112
- Related Report
  2004 Annual Research Report
[Journal Article] 最近傍識別による背景差分と色検出の統合-事例に基く情報統合-2004
- Author(s)
  加藤丈和, 和田俊和
- Journal Title
  
  情報処理学会論文誌:コンピュータビジョンとイメージメディア 45・SIG13(CVIM10)
  
  Pages: 110-117
- Related Report
  2004 Annual Research Report
[Journal Article] 階層的句アライメントを用いた統計的機械翻訳2004
- Author(s)
  渡邊太郎, 今村, 隅田英一郎, 奥乃博
- Journal Title
  
  電子情報通信学会論文誌 J87-D2・4
  
  Pages: 978-986
- Related Report
  2004 Annual Research Report
[Journal Article] Improvement of Robot Audition by Interfacing Sound Source Separation and Automatic Speech Recognition with Missing Feature Theory2004
- Author(s)
  Shun'ich Yamamoto, Kazuhiro Nakadai, Hiroshi Tsujino, Toshio Yokoyama, Hiroshi G.Okuno
- Journal Title
  
  Proceedings of IEEE-RAS International Conference on Robots and Automation (ICRA-2004)
  
  Pages: 1517-1523
- Related Report
  2004 Annual Research Report
[Journal Article] Conic-Based Algorithm for Visual Line Estimation from One Image2004
- Author(s)
  H.Wu, Q.Chen, Toshikazu Wada
- Journal Title
  
  Proceedings of IEEE Conference on FG'04
  
  Pages: 260-265
- NAID
  110003314242
- Related Report
  2004 Annual Research Report
[Journal Article] Comparing Features for Forming Music Streams in Automatic Music Transcription2004
- Author(s)
  Yohei Sakuraba, Tetsuro Kitahara, Hiroshi G.Okuno
- Journal Title
  
  Proceedings of 2004 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP'2004) IV
  
  Pages: 273-276
- NAID
  110002913475
- Related Report
  2004 Annual Research Report
[Journal Article] Category-level Identification of Non-registered Musical Instrument Sounds2004
- Author(s)
  Tetsuro Kitahara, Masataka Goto, Hiroshi G.Okuno
- Journal Title
  
  Proceedings of 2004 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP'2004) IV
  
  Pages: 253-256
- Related Report
  2004 Annual Research Report
[Journal Article] Recognition of Emotional States in Spoken Dialogue with a Robot2004
- Author(s)
  Kazunori Komatani, Ryosuke Itoh, Tatusya Kawahara, Hiroshi G.Okuno
- Journal Title
  
  Innovations in Applied Artificial Intelligence (IEA/AIE-04) LNA13029
  
  Pages: 413-423
- Related Report
  2004 Annual Research Report
[Journal Article] Automatic Sound-Imitation World Recognition from Environmental Sounds focusing on Ambiguity Problem in Determining Phonemes2004
- Author(s)
  Kazushi Ishihara, Tomohiro Nakatani, Tetsuya Ogata, Hiroshi G.Okuno
- Journal Title
  
  PRICAI 2004 : Trends in Artificial Intelligence LNA13157
  
  Pages: 909-918
- Related Report
  2004 Annual Research Report
[Journal Article] Efficient Confirmation Strategy for Large-scale Text Retrieval Systems with Spoken Dialogue Interface2004
- Author(s)
  Kazunori Komatani, Teruhisa Misu, Tatsuya Kawahara, Hiroshi G.Okuno
- Journal Title
  
  Proceedings of the 20th International Conference on Computational Linguistics (Coling-2004)
  
  Pages: 1100-1106
- Related Report
  2004 Annual Research Report
[Journal Article] Assessment of General Applicability of Robot Audition System by Recognizing Three Simultaneous Speeches2004
- Author(s)
  Shun'ichi Yamamoto, Kazuhiro Nakadai, Hiroshi Tsujino, Hiroshi G.Okuno
- Journal Title
  
  Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2004)
  
  Pages: 2111-2116
- Related Report
  2004 Annual Research Report
[Journal Article] 音高による音色変化に着目した楽器音の音源同定 : F0依存多次元正規分布に基づく識別手法2003
- Author(s)
  北原鉄朗, 後藤孝, 奥乃博
- Journal Title
  
  情報処理学会論文誌 44・10
  
  Pages: 2448-2458
- NAID
  110002711583
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] ヒューマノイドを対象にした視聴覚統合による実時間人物追跡 : アクティブオーディションと顔認識の統合2003
- Author(s)
  中臺一博, 日台健一, 奥乃博, 溝口博, 北野宏明
- Journal Title
  
  ロボット学会誌 21・5
  
  Pages: 1333-1342
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] 最近傍識別器を用いた色ターゲット検出2003
- Author(s)
  和田俊和
- Journal Title
  
  情報処理学会論文誌 : コンピュータビジョンとイメージメティア 44・CVIM 8
  
  Pages: 126-135
- NAID
  110002712009
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Musical Instrument Identification Considering Pitch-dependent Characteristics of Timbre : A Classifier Based on FO-dependent Multivariate Normal Distribution (in Japanese)2003
- Author(s)
  Tetsuro Kitahara, Masataka Goto, Hiroshi G.Okuno
- Journal Title
  
  IPSJ Journal Vol.44, No.10
  
  Pages: 2448-2458
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Real-time Multiple Talker Tracking by Audio-Visual Integration for Humanoids : Integration of Active Audition nad Face Recognition (in Japanese)2003
- Author(s)
  Kazuhiro Nakadai, Ken-ichi Hidai, Hiroshi G.Okuno, Hiroshi Mizoguchi, Hiroaki Kitano
- Journal Title
  
  Journal of Robotic Society of Japan Vol.21, No.5
  
  Pages: 517-525
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Active audition for humanoid robots that can listen to three simultaneous talkers2003
- Author(s)
  Hiroshi G.Okuno, Kazuhiro Nakadai
- Journal Title
  
  Journal of the Acoustical Society of America Vol.113, No.4, Pt.2 of 2
  
  Pages: 2230-2230
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Color-target Detection Based on Nearest Neighbor Classifier (in Japanese)2003
- Author(s)
  Toshikazu Wada
- Journal Title
  
  Transactions on Computer Vision and Image Media Vol.44, No.SIG17 (CVIM8)
  
  Pages: 126-135
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Pitch-dependent Musical Instrument Identification and Its Application to Musical Sound Ontology.2003
- Author(s)
  Tetsuro Kitahara, Masataka Goto, Hiroshi G.Okuno
- Journal Title
  
  Developments in Applied Artificial Intelligence LNAI 2718
  
  Pages: 112-122
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Design and Implementation of Personality of Humanoids in Human Humanoid Non-verbal Interaction.2003
- Author(s)
  Hiroshi G.Okuno, Kazuhiro Nakadai, Hiroaki Kitano
- Journal Title
  
  Developments in Applied Artificial Intelligence LNAI 2718
  
  Pages: 662-673
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Journal Article] Real-time Sound Source Localization and Separation based on Active Audio-Visual Integration.2003
- Author(s)
  Hiroshi G.Okuno, Kazuhiro Nakadai
- Journal Title
  
  Computational Methods in Neural Modeling LNCS 2686
  
  Pages: 118-125
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2006 Final Research Report Summary
[Book] New Frontiers in Artificial Intelligence, LNCS 36092007
- Author(s)
  Shinichi Ueno, et al.
- Total Pages
  548
- Publisher
  Springer Verlag
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Book] PRICA1 2006 : Trends in Artificial Intelligence, LNCS 40992006
- Author(s)
  Shun'ichi Yamamoto, et al.
- Total Pages
  1263
- Publisher
  Springer Verlag
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Book] Advances in Applied Artificial Intelligence (IEA/AIE-2006), LNAI40312006
- Author(s)
  Shun'ichi Yamamoto, et al.
- Total Pages
  1353
- Publisher
  Springer Verlag
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Book] 大人のための「ロボット学」2006
- Author(s)
  PHP研究所, (奥乃博)
- Total Pages
  251
- Publisher
  PHP研究所
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Book] PRICAI 2006 : Trends in Artificial Intelligence, LNCS 40992006
- Author(s)
  Shun' ichi Yamamoto
- Total Pages
  1263
- Publisher
  Springer Verlag
- Related Report
  2006 Annual Research Report
[Book] Advances in Applied Artificial Intelligence (IEA/AIE-2006), LNAI40312006
- Author(s)
  Shun'ichi Yamamoto
- Total Pages
  1353
- Publisher
  Springer Verlag
- Related Report
  2006 Annual Research Report
[Book] 大人のための「ロボット学」2006
- Author(s)
  PHP研究所(奥乃博)
- Total Pages
  251
- Publisher
  PHP研究所
- Related Report
  2005 Annual Research Report
[Book] 人工知能学事典 (Lisp)2005
- Author(s)
  奥乃博
- Total Pages
  976
- Publisher
  共立出版
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Book] 人工知能事典2005
- Author(s)
  人工知能学会(奥乃博)
- Total Pages
  976
- Publisher
  共立出版
- Related Report
  2005 Annual Research Report
[Book] 人工知能学事典(Lisp)2005
- Author(s)
  奥乃博
- Publisher
  共立出版(印刷中)
- Related Report
  2004 Annual Research Report
[Patent(Industrial Property Rights)] 文単位検索方法,文単位検索装置,コンピュータプログラム,記憶媒体,及び文書記憶装置2006
- Inventor(s)
  白松俊, 駒谷和範, 奥乃博
- Industrial Property Rights Holder
  京都大学
- Industrial Property Number
  2006-224563
- Filing Date
  2006-08-21
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Patent(Industrial Property Rights)] 楽器音認識方法,楽器アノテーション方法,及び楽曲検索方法2006
- Inventor(s)
  北原鉄朗, 奥乃博
- Industrial Property Rights Holder
  京都大学
- Industrial Property Number
  2006-058649
- Filing Date
  2006-03-03
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Patent(Industrial Property Rights)] 文単位検索方法,文単位検索装置,コンビュータブログラム,記憶媒体,及び文書記憶装置2006
- Inventor(s)
  白松俊
- Industrial Property Rights Holder
  京都大学
- Industrial Property Number
  2006-224563
- Filing Date
  2006-08-21
- Related Report
  2006 Annual Research Report
[Patent(Industrial Property Rights)] 楽器音認識方法,楽器アノテーション方法,及び楽曲検索方法2006
- Inventor(s)
  北原鉄朗, 奥乃博
- Industrial Property Rights Holder
  京都大学
- Industrial Property Number
  2006-058649
- Filing Date
  2006-03-03
- Related Report
  2005 Annual Research Report
[Patent(Industrial Property Rights)] 音響信号処理方式,音響信号処理装置,音響信号処理システム及びコンピュータブログラム2004
- Inventor(s)
  吉井和佳, 奥乃博, 後藤真孝
- Industrial Property Rights Holder
  京都大学
- Patent Publication Number
  2006-005807
- Filing Date
  2004-06-18
- Acquisition Date
  2006-01-05
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Patent(Industrial Property Rights)] 音響信号処理方式, 音響信号処理装置, 音響信号処理システム及びコンピュータプログラム2004
- Inventor(s)
  吉井和佳, 奥乃博, 後藤真孝
- Industrial Property Rights Holder
  京都大学・産業技術総合研究所
- Industrial Property Number
  2004-181881
- Filing Date
  2004-06-23
- Related Report
  2004 Annual Research Report
[Patent(Industrial Property Rights)] Robot audiovisual system2003
- Inventor(s)
  Nakadai, Okuno, Kitano
- Industrial Property Rights Holder
  JST
- Filing Date
  2003-08-29
- Acquisition Date
  2005-11-22
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Patent(Industrial Property Rights)] Method and Apparatus for Determining Sound Source2000
- Inventor(s)
  Hiroshi G. Okuno 他
- Industrial Property Rights Holder
  JST
- Filing Date
  2000-06-07
- Acquisition Date
  2006-04-25
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2006 Final Research Report Summary
[Publications] Hiroshi G.Okuno, Kazuhiro Nakadai, Tino Lourens, Hiroaki Kitano: "Sound and Visual Tracking for Humanoid Robot"Applied Intelligence. Vol.20,No.3. 253-266 (2004)
- Related Report
  2003 Annual Research Report
[Publications] 北原鉄朗, 後藤真孝, 奥乃博: "音響的類似性を反映した楽器の階層表現の獲得とそれに基づく未知楽器のカテゴリーレベルの音源同定"情報処理学会論文誌. Vol.45.No.3. 680-689 (2004)
- Related Report
  2003 Annual Research Report
[Publications] 山肩洋子, 河原達也, 奥乃博, 美濃導彦: "音声対話システムにおける物体指示のための信念ネットワークを用いた曖昧性の解消"人工知能学会誌. Vol.19,No.1F. 47-56 (2004)
- Related Report
  2003 Annual Research Report
[Publications] 北原鉄朗, 後藤孝, 奥乃博: "音高による音色変化に着目した楽器音の音源同定:F0依存多次元正規分布に基づく識別手法"情報処理学会論文誌. Vol.44,No.10. 2448-2458 (2003)
- Related Report
  2003 Annual Research Report
[Publications] 中臺一博, 日台健一, 奥乃博, 溝口博, 北野宏明: "ヒューマノイドを対象にした視聴覚統合による実時間人物追跡:アクティブオーディションと顔認識の統合"ロボット学会誌. Vol.21,No.5. 517-525 (2003)
- Related Report
  2003 Annual Research Report
[Publications] 駒谷和範, 鹿島博晶, 田中克明, 河原達也: "複合的言語制約に基づくキーフレーズ検出を用いた汎用的なデータベース検索音声対話プラットフォーム"情報処理学会論文誌. Vol.44,No.5. 1333-1342 (2003)
- Related Report
  2003 Annual Research Report
[Publications] Hiroshi G.Okuno, Kazuhiro Nakadai: "Active audition for humanoid robots that can listen to three simultaneous talkers"Journal of the Acoustical Society of America. Vol.113,No.4,Pt.2 of 2. 2230-2230 (2004)
- Related Report
  2003 Annual Research Report
[Publications] 和田俊和: "最近傍識別器を用いた色ターゲット検出"情報処理学会論文誌:CVIM. No.8. 126-135 (2003)
- Related Report
  2003 Annual Research Report
[Publications] 奥乃博, 中臺一博: "ロボット聴覚の課題と現状"情報処理. Vol.44,No.11. 1138-1144 (2003)
- Related Report
  2003 Annual Research Report
[Publications] Kazuhiro Nakadai, Daisuke Matsuura, Hiroshi G.Okuno, Hiroaki Kitano: "Applying Scattering Theory to Robot Audition System"Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2003). 1147-1152 (2003)
- Related Report
  2003 Annual Research Report
[Publications] M.Seki, Toshikazu Wada, H.Fujiwara, K.Sumi: "Background Subtraction based on Cooccurrence of Image Variations"Proceedings of Computer Vison and Pattern Recognition (CVPR-2003). 65-72 (2003)
- Related Report
  2003 Annual Research Report
[Publications] Yohei Sakuraba, Hiroshi G.Okuno: "Note Recognition of Polyphonic Music by Using Timbre Similarity and Direction Proximity"Proceedings of International Computer Music Conference (ICM2003). 167-170 (2003)
- Related Report
  2003 Annual Research Report
[Publications] Kazuhiro Nakadai, Hiroshi G.Okuno, Hiroaki Kitano: "Realizing Personality in Audio-Visually Triggered Non-verbal Behaviors"Proceedings of IEEE-RAS International Conference on Robots and Automation (ICRA-2003). 392-397 (2003)
- Related Report
  2003 Annual Research Report
[Publications] Kazuhiro Hakadai, Hiroshi G.Okuno, Hiroaki Kitano: "Robot Recognizes Three Simultaneous Speech By Active Audition"Proceedings of IEEE-RAS International Conference on Robots and Automation (ICRA-2003). 398-403 (2003)
- Related Report
  2003 Annual Research Report
[Publications] Kazuhiro Nakadai, D.Matsuura, Hiroshi G.Okuno, Hiroshi Tsujino: "Improvement of Three Simultaneous Speech Recognition by Using AV Integration and Scattering Theory for Humanoid"Proceedings of Audio Visual Spoken Processing (AVSP-2003). 157-162 (2003)
- Related Report
  2003 Annual Research Report
[Publications] Kazunori Komatani, S.Ueno, Tatsuya Kawahara, Hiroshi G.Okuno: "User Modeling in Spoken Dialogue Systems for Flexible Guidance Generation"Proceedings of the Eighth European Conference on Speech communication and Technology (Eurospeech-2003). 745-748 (2003)
- Related Report
  2003 Annual Research Report
[Publications] Kazushi Ishihara, Yasushi Tsubota, Hiroshi G.Okuno: "Automatic Transformation of Environmental Sounds into Sound-Imitation Words Based on Japanese Syllable Structure"Proceedings of the Eighth European Conferenece on Speech communication and Technology (Eurospeech-2003). 3185-3188 (2003)
- Related Report
  2003 Annual Research Report
[Publications] Kazuhiro Nakadai, D.Matsuura, Hiroshi G.Okuno, Hiroshi Tsujino: "Three Simultaneous Speech Recognition by Integration of Active Audition and Face Recognition for Humanoid"Proceedings of the Eighth European Conferenece on Speech communication and Technology (Eurospeech-2003). 2705-2708 (2003)
- Related Report
  2003 Annual Research Report
[Publications] Tatsuya Kawahara, Ryosuke Ito, Kazunori Komatani: "Spoken Dialogue System for Queries on Appliance Manuals using Hierarchical Confirmation Strategy"Proceedings of the Eighth European Conferenece on Speech communication and Technology (Eurospeech-2003). 1701-1704 (2003)
- Related Report
  2003 Annual Research Report
[Publications] Kazunori Komatani, S.Ueno, Tatsuya Kawahara, Hiroshi G.Okuno: "Flexible Guidance Generation using User Model in Spoken Dialogue Systems"Proceedings of the 41st Annual Meeting of the Association for Computational Linguistics (ACL 2003). 256-263 (2003)
- Related Report
  2003 Annual Research Report
[Publications] Tetsuro Kitahara, Masataka Goto, Hiroshi G.Okuno: "Musical Instrument Identification based on F0-dependent Multivariate Normal Distribution"Proceeding of 2003 International Conference on Multimedia and Expo (ICME 2003). Vol.III. 405-409 (2003)
- Related Report
  2003 Annual Research Report
[Publications] Tetsuro Kitahara, Masataka Goto, Hiroshi G.Okuno: "Pitch-dependent Musical Instrument Indentification and Its Application to Musical Sound Ontology"Developments in Applied Artificial Intelligence. LNAI 2718. 112-122 (2003)
- Related Report
  2003 Annual Research Report
[Publications] Hiroshi G.Okuno, Kazuhiro Nakadai, Hiroaki Kitano: "Design and Implementation of Personality of Humanoids in Human Humanoid Non-verbal Interaction"Developments in Applied Artificial Intelligence. LNAI 2718. 662-673 (2003)
- Related Report
  2003 Annual Research Report
[Publications] Hiroshi G.Okuno, Kazuhiro Nakadai: "Real-time Sound Source Localization and Separation based on Active Audio-Visual Integration"Computational Methods in Neural Modeling. LNCS 2686. 118-125 (2003)
- Related Report
  2003 Annual Research Report
[Publications] Tetsuro Kitahara, Masataka Goto, Hiroshi G.Okuno: "Musical Instrument Identification based on F0-dependent Multivariate Normal distribution"Proceedings of 2003 International Conference on Acoustics, Speech and Signal Processing (ICASSP'2003). Vol.5Vol.III. 421-424 (2003)
- Related Report
  2003 Annual Research Report
[Publications] 奥乃博: "AI事典、第2版"共立出版. 544 (2003)
- Related Report
  2003 Annual Research Report

Study on Computational Auditory Scene Analysis for Humanoids by Active Audition

Principal Investigator

OKUNO Hiroshi Kyoto University, G.Graduate School of Informatics, Professor, 情報学研究科, 教授 (60318201)

¥51,350,000 (Direct Cost: ¥39,500,000、Indirect Cost: ¥11,850,000)

Report

Research Products

[Journal Article] マルチドメイン音声対話システムにおける対話履歴を利用したドメイン選択2007

Author(s)

Journal Title

Description

Related Report

[Journal Article] Drumix : An Audio Player with Functions of Realtime Drum-Part Rearrangement for Active Music Listening2007

Author(s)

Journal Title

Description

Related Report

[Journal Article] Instrogram : Probabilistic Representation of Instrument Existence for Polyphonic Music2007

Author(s)

Journal Title

Description

Related Report

[Journal Article] 動的リコンフィギャラブルデバイスDRPを用いたロボット聴覚のための音源分離フィルタ2007

Author(s)

Journal Title

Description

Related Report

[Journal Article] 音源分離との統合によるミッシングフィーチャマスク自動生成に基づく同時発話音声認識2007

Author(s)

Journal Title

Description

Related Report

[Journal Article] Drum Sound Recognition for Polyphonic Audio Signals by Adaptation and Matching of Spectral Templates with Harmonic Harmonic Structure Suppression2007

Author(s)

Journal Title

Description

Related Report

[Journal Article] Instrument Identification in Polyphonic Music : Feature Weighting to Minimize Influence of Sound Overlaps2007

Author(s)

Journal Title

Description

Related Report

[Journal Article] 音環境理解から観たロボット聴覚2007

Author(s)

Journal Title

Description

Related Report

[Journal Article] Robust Domain Selection Using Dialogue History in Multi-domain Spoken Dialogue Systems (in Japanese)2007

Author(s)

Journal Title

Description

Related Report

[Journal Article] Drumix : An Audio Player with Functions of Realtime Drum-Part Rearrangement for Active Music Listening2007

Author(s)

Journal Title

Description

Related Report

[Journal Article] Instrogram : Probabilistic Representation of Instrument Existence for Polyphonic Music2007

Author(s)

Journal Title

NAID

Description

Related Report

[Journal Article] Sound Source Separation Filter for Robot Audition used by Dynamic Reconfigurable Device, DRP (in Japanese)2007

Author(s)

Journal Title

Description

Related Report

[Journal Article] Simultaneous Speech Recognition based on Automatic Missing-Feature Mask Generation integrated with Sound Source Separation (in Japanese)2007

Author(s)

Journal Title

Description

Related Report

[Journal Article] Drum Sound Recognition for Polyphonic Audio Signals by Adaptation and Matching of Spectral Templates with Harmonic Harmonic Structure Suppression2007

Author(s)

Journal Title

Description

Related Report

[Journal Article] Instrument Identification in Polyphonic Music : Feature Weighting to Minimize Influence of Sound Overlaps2007

Author(s)

Journal Title