• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

音響信号記号変換に基づいたセマンティックインタラクション

Research Project

Project/Area Number 18049048
Research Category

Grant-in-Aid for Scientific Research on Priority Areas

Allocation TypeSingle-year Grants
Review Section Science and Engineering
Research InstitutionKyoto University

Principal Investigator

奥乃 博  京都大学, 情報学研究科, 教授 (60318201)

Co-Investigator(Kenkyū-buntansha) 駒谷 和範  京都大学, 情報学研究科, 助手 (40362579)
Project Period (FY) 2006
Project Status Completed (Fiscal Year 2006)
Budget Amount *help
¥6,500,000 (Direct Cost: ¥6,500,000)
Fiscal Year 2006: ¥6,500,000 (Direct Cost: ¥6,500,000)
Keywordsロボット聴覚 / 音環境理解 / 視聴覚情報統合 / 音楽情報処理 / 市販CD音楽音響信号 / ミッシングフィーチャ理論 / マスク自動生成 / 遺伝的アルゴリズム
Research Abstract

情報爆発という特定領域テーマに対して、音情報、すなわち、i-explosion_soundという観点から、
(1)あまり使用されていない音響信号(単音音声に加えて、混合音声や音楽や環境音から音情報を取得することによる情報爆発の促進、
(2)ディジタル音響信号処理による爆発する音情報から質的複雑化の軽減、
という2つの側面について取り組んだ。主な研究項目は以下の通りである。
(1)混合音の認識:「三話者同時発話認識の高性能化・高速化」
これまで開発してきたシステムは,音源定位(steered beamforer)、音源分離(GSS,ICA)、ミッシングマスク生成、ミッシングフィーチャ理論による音声認識から構成されており、三話者が同時に発話した後、分離・認識して、応答するまでに約8秒かかっていた。これに対して、RASP-2信号処理装置を使用したシステム再構成、Flow Designerによるシステム内のモジュールインタフェースの統一、および、GAによる多数のシステムパラメータのチューニングを行い、認識応答速度の高速化(1.9秒と約4倍の高速化)、および,認識率の向上が達成できた。
(2)実環境への対応と実時間処理:
上記の三話者同時発話認識では、マルチメディア実験室(5m*7m)で実際の人を用いて実験が行えるレベルまで性能が向上した。また、混合音声だけでなく、ドラム音を含むポリフォニー音楽音響信号に対しても、ドラムパターンを認識し、実時間でドラム音を編集できるオーディオプレイヤーを開発した。これにより、ロボットが音楽からビートを聴き分け、トラックできるシステムの基礎技術を確立することができた。

Report

(1 results)
  • 2006 Annual Research Report
  • Research Products

    (24 results)

All 2007 2006

All Journal Article (21 results) Book (2 results) Patent(Industrial Property Rights) (1 results)

  • [Journal Article] Robust Recognition of Simultaneous Speech By a Mobile Robot2007

    • Author(s)
      Jean-Marc Valin
    • Journal Title

      IEEE Transactions on Robotics (採録決定済)

    • Related Report
      2006 Annual Research Report
  • [Journal Article] マルチドメイン音声対話システムにおける対話履歴を利用したドメイン選択2007

    • Author(s)
      神田 直之
    • Journal Title

      情報処理学会論文誌 48・5(印刷中)

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Drumix : An Audio Player with Functions of Realtime Drum-Part Rearrangement for Active Music Listening2007

    • Author(s)
      Kazuyoshi Yoshii
    • Journal Title

      Journal of Information Proceeding Society of Japan 48・3

      Pages: 1229-1239

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Instrogram : Probabilistic Representation of Instrument Existence for Polyphonic Music2007

    • Author(s)
      Tetsuro Kitahara
    • Journal Title

      Journal of Information Proceeding Society of Japan 48・1

      Pages: 214-226

    • Related Report
      2006 Annual Research Report
  • [Journal Article] 音源分離との統合によるミッシングフィーチャマスク自動生成に基づく同時発話音声認識2007

    • Author(s)
      山本 俊一
    • Journal Title

      日本ロボット学会誌 25・1

      Pages: 92-102

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Drum Sound Recognition for Polyphonic Audio Signals by Adaptation and Matching of Spectral Templates with2007

    • Author(s)
      Kazuyoshi Yoshi
    • Journal Title

      IEEE Transactions on Audio, Speech and Language Processing 15・1

      Pages: 333-345

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Instrument Identification in Polyphonic Music : Feature Weighting to Minimize Influence of Sound Overlaps2007

    • Author(s)
      Tetsuro Kitahara
    • Journal Title

      EURASIP Journal on Applied Signal Processing 2007

      Pages: 1-15

    • Related Report
      2006 Annual Research Report
  • [Journal Article] ミッシングフィーチャ理論に基づく音声認識を利用した複数話者同時発話認識2007

    • Author(s)
      山本 俊一
    • Journal Title

      計測と制御 46・6(採録決定済)

    • Related Report
      2006 Annual Research Report
  • [Journal Article] 音環境理解から観たロボット聴覚2007

    • Author(s)
      奥乃 博
    • Journal Title

      日本音響学会誌 63・1

      Pages: 29-34

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Meaning-Game-based Centering Model with Statistical Definition of Utility of Referential Expression and Its Verification2007

    • Author(s)
      Shun Shiramatsu
    • Journal Title

      Proceedings of DAARC 2007 1

      Pages: 121-126

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Computational Auditory Scene Analysis and Its Application to Robot Audition : Five Years Experience2007

    • Author(s)
      Hiroshi G. Okuno
    • Journal Title

      Proceedings of ICKS 2007 1

      Pages: 69-76

    • Related Report
      2006 Annual Research Report
  • [Journal Article] 多重奏を対象とした音源同定 : 混合音テンプレートを用いた音の重なりに頑健な特徴量への重みづけおよび音楽的文脈の利用2006

    • Author(s)
      北原 鉄朗
    • Journal Title

      電子情報通信学会論文誌 J89-D・12

      Pages: 2721-2733

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Musical Instrument Recognizer "Instrogram" and Its Application to Music Retrieval based on Instrumentation2006

    • Author(s)
      Tetsuro Kitahara
    • Journal Title

      Proceedins of IEEE ISM 2006 1

      Pages: 265-272

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Automatic synchronization between lyrics and music CD recordings based on Viterbi alignment of segregated vocal2006

    • Author(s)
      Hiromasa Fujihara
    • Journal Title

      Proceedins of IEEE ISM 2006 1

      Pages: 257-264

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Missing-Feature based Speech Recognition for Two Simultaneous Speech Signals Separated by ICA with a pair of Humanoid Ears2006

    • Author(s)
      Ryu Takeda
    • Journal Title

      Proceedings of IROS-2006 1

      Pages: 878-885

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Real-Time Robot Audition System That Recognizes Simultaneous Speech in the Real World2006

    • Author(s)
      Shun'ichi Yamamoto
    • Journal Title

      Proceedings of IROS-2006 4

      Pages: 5333-5338

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Real-Time Tracking of Multiple Sound Sources by Integration of In-Room and Robot-Embedded Microphone Arrays2006

    • Author(s)
      Kazuhiro Nakadai
    • Journal Title

      Proceedings of IROS-2006 1

      Pages: 852-859

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Speaker Identification under Noisy Environments by using Harmonic Structure Extraction and Reliable Frame Weighting2006

    • Author(s)
      Hiromasa Fujihara
    • Journal Title

      Proceedings of Interspeech-2006 2

      Pages: 1459-1462

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Improving Speech Recognition of Two Simultaneous Speech Signals by Integrating ICA BSS and Automatic Missing Feature2006

    • Author(s)
      Ryu Takeda
    • Journal Title

      Proceedings of Interspeech-2006 3

      Pages: 2302-2305

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Dynamic Help Generation by Estimating User's Mental Model in Spoken Dialogue Systems2006

    • Author(s)
      Yuichiro Fukubayashi
    • Journal Title

      Proceedings of Interspeech-2006 2

      Pages: 1946-1949

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Multi-Domain Spoken Dialogue System with Extensibility and Robustness against Speech Recognition Errors2006

    • Author(s)
      Kazunori Komatani
    • Journal Title

      Proceedings of SIGdial Workshop on Discourse and Dialogue 1

      Pages: 9-17

    • Related Report
      2006 Annual Research Report
  • [Book] New Trends in Applied Intelligent Systems, LNCS 45702007

    • Author(s)
      Hyun-Don Kim
    • Publisher
      Springer Verlag(印刷中)
    • Related Report
      2006 Annual Research Report
  • [Book] New Trends in Applied Intelligent Systems, LNCS 45702007

    • Author(s)
      Ryu Takeda
    • Publisher
      Springer Verlag(印刷中)
    • Related Report
      2006 Annual Research Report
  • [Patent(Industrial Property Rights)] 文単位検索方法,文単位検索装置,コンピュータプログラム,記憶媒体,及び文書記憶装置2006

    • Inventor(s)
      白松 俊
    • Industrial Property Rights Holder
      京都大学
    • Industrial Property Number
      2006-224563
    • Filing Date
      2006-08-21
    • Related Report
      2006 Annual Research Report

URL: 

Published: 2006-04-01   Modified: 2018-03-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi