• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Annual Research Report

情報抽出に基づくユーザやドメインに適応的なマルチモーダル対話システム

Research Project

Project/Area Number 13J04537
Research InstitutionKyoto University

Principal Investigator

吉野 幸一郎  京都大学, 情報学研究科, 特別研究員(DC2)

Keywords対話システム / 音声認識 / 述語項構造 / 強化学習
Research Abstract

まず、システムを構成するモジュールの精度向上を、ドメインに応的に行う手法について研究した。具体的には音声対話における音声認識と、音声言語理解における述語項構造解析の精度向上の2種類を行った。
音声認識の精度向上では、音声認識器の学習データに含まれる意味情報に着目し、Webに存在する大量のテキストから適切な学習データを選択する手法を提案した。対象ドメインの文書を種としてWebから関連した文章を収集し、意味的な類似性に着目して、ドメインに合致した文を選択する手法を提案した。意味情報を考慮することにより、音声認識の精度だけでなく音声言語理解の精度も向上することが確認された。
述語項構造解析の向上では、点予測という考え方に注目し、部分的にアノテーションされたコーパスから学習可能な述語項構造解析器を構築する手法を提案した。この枠組みによってドメイン適応のために、ドメイン固有の現象が生じている部分に対してのみ部分的アノテーションを行い、それを利用することが可能となる。この結果、効率的なアノテーションが可能となり、解析器の迅速なドメイン適応が可能となった。
次に、対話制御の獲得を行うため、これまでに構築した対話システムで対話データの収集・分析を行った。この結果、ユーザが何に興味を持っているかという焦点の情報が有用であることが考えられた。そこで、収集したデータを元に焦点の情報を活用する音声対話システムの構築を行った。この構築に際し、部分観測マルコフ決定過程(POMDP)を用いた統計べ一スの対話制御獲得を行った。このシステムを利用してデータの収集・分析を行った結果、ユーザの焦点を用いて、よりユーザに適応的な応答生成を行うことができることが示唆され、今後の研究に活用できると期待できる。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

音声対話システムの言語モデルをドメインに適応する方法、及び述語項構造解析をドメインに適応する方法に関する研究を発展させ、前者については音声処理のトップカンファレンスであるIEEE-ICASSP及び人工知能学会論文誌において、論文が採択・掲載された。後者についても、自然言語処理の国際会議IJCNLPで発表した。さらに、ユーザの焦点に適応的に対話管理を行う方法を確率的な枠組みで設計し、ニュース記事に基づいて対話を行うシステムの実装を進めている。

Strategy for Future Research Activity

現在構築しているユーザの焦点に適応的な音声対話システムを用いて被験者による実験を行い、ユーザの焦点を用いながら対話を行うことの妥当性を検証する。また、研究計画にあるマルチモーダル情報を用いた拡張について検討を行い、その実装・検証を進める。

  • Research Products

    (11 results)

All 2014 2013

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (10 results)

  • [Journal Article] 述語項構造を介した文の選択に基づく音声対話用言語モデルの構築2014

    • Author(s)
      吉野 幸一郎, 森 信介, 河原 達也
    • Journal Title

      人工知能学会論文誌

      Volume: Vol.29, No.1 Pages: 53-59

    • DOI

      10.1527/tjsai.29.53

    • Peer Reviewed
  • [Presentation] ユーザの焦点に適応的な雑談型音声情報案内システム2014

    • Author(s)
      吉野 幸一郎, 河原 達也
    • Organizer
      言語処理学会第18回年次大会
    • Place of Presentation
      北海道大学(北海道札幌市)
    • Year and Date
      2014-03-20
  • [Presentation] 混合方言言語モデルと混合比推定による方言音声認識システム2014

    • Author(s)
      平山 直樹, 吉野 幸一郎, 糸山 克寿, 森 信介, 奥乃 博
    • Organizer
      情報処理学会第76回全国大会
    • Place of Presentation
      東京電機大学(東京都足立区)
    • Year and Date
      2014-03-12
  • [Presentation] ユーザの焦点に適応的な雑談型音声情報案内システム2014

    • Author(s)
      吉野 幸一郎, 河原 達也
    • Organizer
      第70回人工知能学会言語・音声理解と対話処理研究会
    • Place of Presentation
      情報通信研究機構(東京都小金井市)
    • Year and Date
      2014-03-05
  • [Presentation] 傾聴対話における相槌の韻律的特徴の同調傾向の分析2014

    • Author(s)
      上里 美樹, 吉野 幸一郎, 高梨 克也, 河原 達也
    • Organizer
      第70回人工知能学会言語・音声理解と対話処理研究会
    • Place of Presentation
      情報通信研究機構(東京都小金井市)
    • Year and Date
      2014-03-05
  • [Presentation] ユーザの焦点に適応的な音声によるニュース案内システム2014

    • Author(s)
      吉野 幸一郎
    • Organizer
      第100回情報処理学会音声言語情報処理研究会
    • Place of Presentation
      ホテルサンバレー富士見(静岡県伊豆の国市)
    • Year and Date
      2014-01-31
  • [Presentation] Statistical Dialogue Management using Intention Dependency Graph.2013

    • Author(s)
      Koichiro Yoshino, Shinji Watanabe, Jonathan Le Roux, John R. Hershey
    • Organizer
      The 6th International Conference on Natural Language Processing (IJCNLP2013)
    • Place of Presentation
      名古屋国際会議場(愛知県名古屋市)
    • Year and Date
      2013-10-16
  • [Presentation] Predicate Argument Structure Analysis using Partially Annotated Corpora.2013

    • Author(s)
      Koichiro Yoshino, Shinsuke Mori, Tatsuva Kawahara
    • Organizer
      The 6th International Conference on Natural Language Processing (IJCNLP2013)
    • Place of Presentation
      名古屋国際会議場(愛知県名古屋市)
    • Year and Date
      2013-10-16
  • [Presentation] Automatic Estimation of Dialect Mixing Ratio for Dialect Speech Recognition.2013

    • Author(s)
      Naoki Hirayama, Koichiro Yoshino, Katsutoshi Itoyama, Shinsuke Mori, and Hiroshi G. Okuno.
    • Organizer
      The 14th Annual Conference on the International Speech Communication Association (INTERSPEECH 2013)
    • Place of Presentation
      Lyon Convention Center (Lyon, France)
    • Year and Date
      2013-08-27
  • [Presentation] 述語項構造を介したWebテキストからの文選択に基づく言語モデルの評価2013

    • Author(s)
      吉野 幸一郎, 森 信介, 河原 達也
    • Organizer
      第97回情報処理学会音声言語情報処理研究会
    • Place of Presentation
      壮鳳(宮城県刈田郡蔵王町)
    • Year and Date
      2013-07-26
  • [Presentation] Incorporating Semantic Information to Selection of Web Texts for Language Model of Spoken Dialogue System.2013

    • Author(s)
      Koichiro Yoshino, Shinsuke Mori, Tatsuya Kawahara
    • Organizer
      The 38th IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP21) 13)
    • Place of Presentation
      Vancouver Convention Center (Vancouver, Canada)
    • Year and Date
      2013-05-27

URL: 

Published: 2015-07-15  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi