• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2005 Fiscal Year Annual Research Report

実時間視聴覚情報統合による複数の人とのマルチモーダル・インタラクションの研究

Research Project

Project/Area Number 16016251
Research InstitutionKyoto University

Principal Investigator

奥乃 博  京都大学, 情報学研究科, 教授 (60318201)

Co-Investigator(Kenkyū-buntansha) 駒谷 和範  京都大学, 情報学研究科, 助手 (40362579)
Keywords音環境理解 / 視聴覚情報統合 / ロボット知覚 / GSS / 自動マスク生成 / 文脈的制約 / 空間マッピング / ミッシングフィーチャ
Research Abstract

最終年度は、ミッシングフィーチャ理論および視聴覚情報統合による複数同時発話認識の洗練化に主としてに取り組んだ。具体的には、マイクロフォンアレイによる音源分離GSSとミッシングフィーチャ理論による音声認識との統合システムの詳細な評価を行うとともに、距離や位置に依存したインタラクションシステムのためにさまざまな設定での評価とその洗練化に取り組んだ。主な成果は以下の通りである。
(1)音源分離にGeometrical Source Separationとmulti-channel post-filterを使用し、後者から得られるチャネル間リーク情報と背景雑音情報を基にマスクを自動作成した。自動生成されたマスクを使用し,マルチバンド版Juliusを用いて認識を行った。ここで、特徴量をスペクトル歪みに強いMSLSとした。同じベンチマークにより、アプリオリマスクの場合と比較し、約62%の性能を達成した。さらに、さまざまな方向と距離に対して評価し、内部パラメータ13個の最適値にあまり規則性がないことが判明し、遺伝的アルゴリズムにより、最適値探索を行い、その有効性を確認した。
(2)人間親密度を空間にマッピングすることにより、複数人とのインタラクションを行うシステムを開発し、被験者による評価実験により有効性を確認した。これによりどの位置に立った人とインタラクションをすべきか、という挙動設計モデルが確立できた。
(3)柔軟な対話戦略を有した音声対話システムの開発するために、対話の進行モデルと履歴の構造モデルという2つの文脈的特徴を使用する手法を開発した。レストラン検索システムにどう手法を実装し、一発話から得られる特徴だけを使用した場合と比較して、意味理解精度が83.4%から92.6%まで向上した。さらに、レストラン検索システムデータの学習で得られた決定木がたの検索システムでも有効であることが分かり、ドメイン非依存な文脈手法を確立できた。

  • Research Products

    (24 results)

All 2006 2005

All Journal Article (21 results) Book (2 results) Patent(Industrial Property Rights) (1 results)

  • [Journal Article] Common Acoustical Pole Estimation from Multi-Channel Musical Audio Signals2006

    • Author(s)
      Takuya Yoshioka
    • Journal Title

      EICE Trans.on Fundamentals of Electronics, Communications, and Computer Sciences E89-A・1

      Pages: 240-247

  • [Journal Article] Using Multiple Edit Distances to Automatically Grade Outputs from Machine Translation Systems,2006

    • Author(s)
      Yasuhiro Akiba
    • Journal Title

      IEEE Transactions on Audio, Speech and Language Processing 14・2

      Pages: 393-402

  • [Journal Article] ミッシングフィーチャ理論を利用した音源分離と音声認識のインターフェースと複数ロボットへの適用2005

    • Author(s)
      山本 俊一
    • Journal Title

      日本ロボット学会誌 23・6

      Pages: 743-751

  • [Journal Article] ゲーム理論による中心化理論の解体と実言語データに基づく検証.2005

    • Author(s)
      白松 俊
    • Journal Title

      自然言語処理 12・3

      Pages: 91-110

  • [Journal Article] 非線形振動子による引き込みを利用した仮想空間における歩行2005

    • Author(s)
      小鷹 研理
    • Journal Title

      ヒューマンインタフェース学会論文誌 17・4

      Pages: 26-36

  • [Journal Article] Pitch-dependent identification of musical instrument sounds2005

    • Author(s)
      Tetsuro Kitahara
    • Journal Title

      Applied Intelligence, 23・3

      Pages: 267-275

  • [Journal Article] Extracting Multi-Modal Dynamics of Objects using RNNPB2005

    • Author(s)
      Tetsuya Ogata
    • Journal Title

      Journal of Robotics and Mechatropics, 17・6

      Pages: 681-688

  • [Journal Article] Distance Based Dynamic Interaction of Humanoid Robot with Multiple People2005

    • Author(s)
      Tsuyoshi Tasaki
    • Journal Title

      Lecture Notes in Artificial Intelligence 3533

      Pages: 111-120

  • [Journal Article] 超音波センサアレイを用いたアクティブセンシングによる3次元物体の位置・形状認識2005

    • Author(s)
      奥乃 博
    • Journal Title

      超音波テクノ 2005・9-10

      Pages: 79-84

  • [Journal Article] Empirical Verification of Meaning-Game-based Generalization of Centering Theory with Large Japanese2005

    • Author(s)
      Shun Shiramatsu
    • Journal Title

      Proceedings of the 19th Pacific Asia Conference on Language, Information, and Computation (PACLIC 19)

      Pages: 192-210

  • [Journal Article] INTER : D A Drum Sound Equalizer for Controlling Volume and Timbre of Druams2005

    • Author(s)
      Kazuyoshi Yoshii
    • Journal Title

      Proceedings of 2nd European Workshop on the Integration of Knowledge, Semantic and Digital Media Technologies (EWIMT

      Pages: 205-212

  • [Journal Article] Walking with Body-sense in Virtual Space Using the Nonlinear Oscillator2005

    • Author(s)
      Kenri Kodaka
    • Journal Title

      Proceedings of the International Conference on Systems, Man and Cybernetics (SIC-2005)

      Pages: 324-329

  • [Journal Article] INSTRUMENT IDENTIFICATION IN POLYPHONIC MUSIC : FEATURE WEIGHTING WITH MIXED SOUNDS, PITCH-DEPENDENT TIMBRE2005

    • Author(s)
      Tetsuro Kitahara
    • Journal Title

      Proceedings of 6th International Conference on Musical Information Retreival (ISMIR-2005)

      Pages: 558-563

  • [Journal Article] SINGER IDENTIFICATION BASED ON ACCOMPANIMENT SOUND REDUCTION AND RELIABLE FRAME SELECTION2005

    • Author(s)
      Hiromasa Fujihara
    • Journal Title

      Proceedings of 6th International Conference on Musical Information Retreival (ISMIR-2005)

      Pages: 329-336

  • [Journal Article] Multiple Moving Speaker Tracking by Microphone Array on Mobile Robot2005

    • Author(s)
      Masamitsu Murase
    • Journal Title

      Proceedings of the Nineth European Conference on Speech Communication and Technology (Interspeech-2005)

      Pages: 249-252

  • [Journal Article] Contextual Constraints based on Dialogue Models in Database Search Task for Spoken Dialogue Systems2005

    • Author(s)
      Kazunori Komatani
    • Journal Title

      Proceedings of the Nineth European Conference on Speech Communication and Technology (Interspeech-2005)

      Pages: 877-880

  • [Journal Article] Generating Confirmation to Distinguish Phonologically Confusing Word Pairs in Spoken Dialogue Systems2005

    • Author(s)
      Kazunori Komatani
    • Journal Title

      Proceedings of 4th IJCAI Workshop on Knowledge and Reasoning in Practical Dialogue Systems

      Pages: 40-45

  • [Journal Article] Making A Robot Recognize Three Simultaneous Sentences in Real-Time2005

    • Author(s)
      Shun'ichi Yamamoto
    • Journal Title

      Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2005)

      Pages: 897-892

  • [Journal Article] Implementation of Active Direction-Pass Filter on Dynamically Reconfigurable Processo2005

    • Author(s)
      Syunsuke Kurotaki
    • Journal Title

      Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2005)

      Pages: 515-520

  • [Journal Article] Spatially Mapping of Friendliness for Human-Robot Interaction2005

    • Author(s)
      Tsuyoshi Tasaki
    • Journal Title

      Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS-2005)

      Pages: 521-526

  • [Journal Article] Enhanced Robot Speech Recognition Based on Microphone Array Source Separation and Missing Feature Theory2005

    • Author(s)
      Shun'ichi Yamamoto
    • Journal Title

      Proceedings of IEEE RAS International Conference on Robotics and Automation (ICRA-2005)

      Pages: 1489-1494

  • [Book] 大人のための「ロボット学」2006

    • Author(s)
      PHP研究所(奥乃 博)
    • Total Pages
      251
    • Publisher
      PHP研究所
  • [Book] 人工知能事典2005

    • Author(s)
      人工知能学会(奥乃 博)
    • Total Pages
      976
    • Publisher
      共立出版
  • [Patent(Industrial Property Rights)] 楽器音認識方法,楽器アノテーション方法,及び楽曲検索方法2006

    • Inventor(s)
      北原鉄朗, 奥乃博
    • Industrial Property Rights Holder
      京都大学
    • Industrial Property Number
      特願2006-058649号
    • Filing Date
      2006-03-03

URL: 

Published: 2007-04-02   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi