• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2007 Fiscal Year Annual Research Report

マルチメディア型会議録の構造化に関する研究

Research Project

Project/Area Number 18200007
Research InstitutionNational Institute of Advanced Industrial Science and Technology

Principal Investigator

浅野 太  National Institute of Advanced Industrial Science and Technology, 情報技術研究部門, 研究グループ長 (00231895)

Co-Investigator(Kenkyū-buntansha) 麻生 英樹  独立行政時法人産業技術総合研究所, 情報技術研究部門, 主任研究員 (10344194)
河本 満  独立行政時法人産業技術総合研究所, 情報技術研究部門, 研究員 (10300865)
緒方 淳  独立行政時法人産業技術総合研究所, 情報技術研究部門, 研究員 (10392599)
Keywordsマルチメディア / 会議録 / 構造化 / マイクロホンアレイ / 発話分離 / 音源定位 / カメラアレイ
Research Abstract

会議中には、参加者が移動したり、新たな参加者が加わったりするなどの、動的変化がある場合がある。このような場合、従来のマイクロホンアレイを用いた収音システムでは、ターゲットを特定できず、効果的な音源分離も望めない。そこで、マイクロホンアレイを用いて、会議中に移動する人物の軌跡を推定するアルゴリズムを開発した。この手法は、パーティクルフィルタを用いて、複数人物の移動した軌跡を推定するものである。特に、発話のON/OFFにより、音源数が動的に変化した揚合でも、音源数を推定しながら、同時に軌跡を推定できる点が、従来の手法と大きく異なる点である。購入した3次元計測装置により、会議中の人物位置を計測し、これを真値として、評価実験を行った。この結果、従来法に比べ、二乗平均誤差が3分の1程度に減少し、実用レベルに近い性能に達したものと考えている。この結果は、国際会議ICSIP2007で発表した。
画像処理部においては、昨年度より引き続き、人物行動認識アルゴリズムの改良による精度向上に取り組んだ。人物位置認識アルゴリズムは、確率的な焼き鈍し処理を加えることで、誤検出の多い実環境においても、高い精度で人物位置の推定を可能にしたものである。その成果を国際会議MVA2007において発表した。本年度収録した顔方向データベースを用いて人物の視線方向を推定する認識器を作成した。また、視線方向などの表層的情報だけでなく、会話の文脈に関する情報を持つことで、誰が誰に対して喋っているかを推定するアルゴリズムを開発しその成果を国際会議ICMI2007において発表した。

  • Research Products

    (5 results)

All 2007

All Journal Article (5 results) (of which Peer Reviewed: 5 results)

  • [Journal Article] Detection and Separation of Speech Events inMeeting Recordings Using a Microphone Array2007

    • Author(s)
      F.Asano, K.Yamamoto, J.Ogata, M.Yamada, M.Nakamura
    • Journal Title

      EURASIP Journal on Audio, Speech, and Music Processing Volume2007

      Pages: Article ID2761

    • Peer Reviewed
  • [Journal Article] Detection of Overlapping Speech in Meeting Recordings using the Modified Exponential Ftting Test2007

    • Author(s)
      A.Quinlan and F.Asano
    • Journal Title

      Proc.Eusipco 2007

      Pages: 2360-2364

    • Peer Reviewed
  • [Journal Article] Tracking A Varing Number of Sound Sources Using Particle Filtering2007

    • Author(s)
      A.Quinlan, M. Kawamoto, F.Asano, H.Asoh, K.Yamamoto
    • Journal Title

      Proc.IASTED International Conference Signal and Image processing

      Pages: 123-128

    • Peer Reviewed
  • [Journal Article] Multi Human Trajectory Estimation using Stochastic Sampling and its Application to Meeting Recognition2007

    • Author(s)
      Yosuke Matsusaka, Hideki Asoh, Futoshi Asano
    • Journal Title

      Proceedings of IAPR Machine Vision Applications

    • Peer Reviewed
  • [Journal Article] Simultaneous Prediction of Dialog Acts and Address Types in Three-party Conversations2007

    • Author(s)
      Yosuke Matsusaka, Mika Enomoto, Yasuharu Den
    • Journal Title

      Proceedings of the 9th International Conference on Multimodal Interfaces

      Pages: 66-73

    • Peer Reviewed

URL: 

Published: 2010-02-04   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi