• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2008 Fiscal Year Annual Research Report

周波数領域両耳聴モデルを利用した視聴覚連携による空間情報抽出システムの開発

Research Project

Project/Area Number 18500135
Research InstitutionKumamoto University

Principal Investigator

宇佐川 毅  Kumamoto University, 大学院・自然科学研究科, 教授 (30160229)

Co-Investigator(Kenkyū-buntansha) 苣木 禎史  熊本大学, 大学院・自然科学研究科, 助教 (50284740)
Keywords周波数領域両耳聴モデル / 空間情報抽出モデル / 視聴覚情報連携 / FDBM / 実時間システム / 音源方向推定 / 顔画像抽出 / カメラ制御
Research Abstract

音声および音響情報に含まれる空間情報は,視覚情報と連携することにより,極めて有用性の高い情報となる。聴覚的空間情報と視覚的空間情報の連携は,人間の持つ柔軟性を模擬しそれを発展させるには,必要不可欠な要素である。特に,視聴覚に基づく空間情報の時間差分は,より高い精度の空間的情報を,より多くの機能を持たせた形で利用可能と考えられる。本研究では,すでに開発した周波数領域両耳聴モデルを発展させ,聴覚的空間情報の抽出機能を向上するとともに,視覚的空間情報と連携させてることで,両空間情報を補完的に統合することにより,これまでにない高精度な空間情報の抽出と,それに基づく高品質な情報抽出機能を実現することを目的と,本年度は次の2点について研究を行った。(A)視覚的空間情報と聴覚的空間情報の相補的連携:視覚的空間情報との有機的な連携について研究を進めた。特に視覚情報との連携を,単一のCPUで実時間動作するシステムの実装を試みた。(B)視覚領域での顔画像を中心とした空間情報抽出:視覚情報から複数の発話者が存在する場合についての顔領域の検出を試み,「音源候補」領域の抽出を実装した。
上記の取り組みに際して,カメラの回転運動にともなる空間情報の時間差分情報活用や,移動する音源に対して聴覚的空間情報と視覚的空間情報が相補的に統合された情報の時間変化を統合することによる検出精度の向上についても検討した。

  • Research Products

    (9 results)

All 2009 2008

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (7 results)

  • [Journal Article] On bit rate reduction of Inter-Channel Communication for a Binaural Hearing Assistance System2008

    • Author(s)
      Y. Chisaki
    • Journal Title

      IEICE Trans. Fundamentals E91-A

      Pages: 2041-2044

    • Peer Reviewed
  • [Journal Article] Azimuthal and elevation localizationusing inter-channel phase and level differences for a hemispheric object2008

    • Author(s)
      Y. Chisaki
    • Journal Title

      IEICE Trans. Fundamentals E91-A

      Pages: 3059-3062

    • Peer Reviewed
  • [Presentation] 周波数領域両耳聴モデルによる音源分離性能における定量評価-音源方向への依存性についての検討-2009

    • Author(s)
      冨田 美奈
    • Organizer
      電子情報通信学会技術研究報告
    • Place of Presentation
      大分市
    • Year and Date
      2009-11-21
  • [Presentation] An Objective Evaluation of Segregated Speech Signal By Means of Frequency Domain Binaural Model2008

    • Author(s)
      Tsuyoshi Usagawa
    • Organizer
      日本音響学会聴覚研究会資料
    • Place of Presentation
      唐津市
    • Year and Date
      2008-12-13
  • [Presentation] 両耳補聴システムのための周波数領域両耳聴モデルを用いた音源分離-時間-周波数フィルタリングによるミュージカルノイズの低減-2008

    • Author(s)
      河野亮詞
    • Organizer
      電子情報通信学会技術研究報告
    • Place of Presentation
      大分市
    • Year and Date
      2008-11-21
  • [Presentation] Microphone array system equipped on a security camera-Detection of sound event-r2008

    • Author(s)
      Taisuke Katayama
    • Organizer
      The 6th Kumamoto University Forum
    • Place of Presentation
      インドネシア共和国スラバヤ市
    • Year and Date
      2008-11-04
  • [Presentation] Estimation of sound source direction using a direct sound component extracted from three microphones mounted on a security camera cover2008

    • Author(s)
      M. Nagashini
    • Organizer
      Proceeding of InterNoise 2008
    • Place of Presentation
      中華人民共和国上海市
    • Year and Date
      2008-10-26
  • [Presentation] Quantitative evaluation of sound source segregation performance by means of the frequency domain binaural mode2008

    • Author(s)
      Minako Tomita
    • Organizer
      Proceeding of InterNoise 2008
    • Place of Presentation
      中華人民共和国上海市
    • Year and Date
      2008-10-26
  • [Presentation] 両耳補聴システムにおける音声コーデツクを用いた両耳間通信の検討2008

    • Author(s)
      河野亮詞
    • Organizer
      電子情報通信学会技術研究報
    • Place of Presentation
      本庄市
    • Year and Date
      2008-06-27

URL: 

Published: 2010-06-11   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi