• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Annual Research Report

聞き手の反応に着目した音声会話の解析と生成

Research Project

Project/Area Number 22240013
Research InstitutionKyoto University

Principal Investigator

河原 達也  京都大学, 学術情報メディアセンター, 教授 (00234104)

Co-Investigator(Kenkyū-buntansha) 森 信介  京都大学, 学術情報メディアセンター, 准教授 (90456773)
秋田 祐哉  京都大学, 学術情報メディアセンター, 助教 (90402742)
角 康之  公立はこだて未来大学, システム情報科学部, 教授 (30362578)
Keywords音声認識 / 自然言語解析 / 会話分析 / インタラクション / 話し言葉 / アーカイブ / エージェント
Research Abstract

話し言葉の音声認識に関する研究を進めながら、ニュースのように動的なコンテンツから話題・情報を収集して会話を生成するシステムを設計・実装した。
話し言葉の音声認識では、言語モデルがドメインに関連する表現とフィラーや口語表現などの話し言葉特有の表現の両方をカバーすることが求められる。本研究では、単語・構文などの情報に基づくルールベースの話し言葉テキスト変換と、N-gramの統計的話し言葉変換を組み合わせて、書き言葉スタイルのテキストから話し言葉スタイルの言語モデルを構築する手法を検討した。学会講演音声を対象とした評価実験において、提案手法の効果の評価を行った。
日々更新されるWebニュースなどのテキストに対して、述語項構造に着目した情報抽出を行い、それに基づいて情報検索・推薦を行う音声対話システムを構築した。まず、ドメインごとに有用な述語項構造パターンの抽出を行う指標を検討し、Naive Bayes法に基づく抽出が有効であることを示した。また、抽出された述語項構造に完全に一致するものがない場合でも情報推薦ができるように、前述の指標に基づいて述語項の優先度を決定し、さらに、要素・用言に関して関連度を定義することによって述語項どうしの類似度を計算した。評価実験において、典型的な従来手法であるBag-Of-Words (BOW)モデルと比較して、本手法がより的確に応答生成を行えることが示された。これに加えて、ユーザからの情報要求・発話がなくなった場合に、対話履歴中の述語項との類似度を利用してプロアクティブに情報提示を行う手法を提案した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

音声認識、会話の分析・アノテーション、音声対話システム(会話エージェント)の各要素に関して、成果が出ており、論文発表も順調に行えている。

Strategy for Future Research Activity

各要素をさらに高度化していくとともに、それらの成果を統合したシステムの構築も進めていく予定である。

  • Research Products

    (5 results)

All 2012 2011 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (1 results) Remarks (1 results)

  • [Journal Article] Bayesian learning of a language model from continuous speech2012

    • Author(s)
      G.Neubig, M.Mimura, S.Mori, T.Kawahara
    • Journal Title

      IEICE Trans

      Volume: Vol.E95-D,No.2 Pages: 614-625

    • Peer Reviewed
  • [Journal Article] 述語項の類似度に基づく情報抽出・推薦を行う音声対話システム2011

    • Author(s)
      吉野幸一郎, 森信介, 河原達也
    • Journal Title

      情報処理学会論文誌

      Volume: Vol.52, No.12 Pages: 3386-3397

    • Peer Reviewed
  • [Journal Article] 音声会話コンテンツにおける聴衆の反応に基づく音響イベントとホットスポットの検出2011

    • Author(s)
      河原達也, 須見康平, 緒方淳, 後藤真孝
    • Journal Title

      情報処理学会論文誌

      Volume: Vol.52, No.12 Pages: 3363-3373

    • Peer Reviewed
  • [Presentation] New Transcription System using Automatic Sceech Recognition (ASR) in the Japanese Parliament (Diet)2011

    • Author(s)
      Tatsuya Kawahara
    • Organizer
      Intersteno IPRS
    • Place of Presentation
      フランス・パリ
    • Year and Date
      2011-07-14
  • [Remarks]

    • URL

      http://www.ar.media.kyoto-u.ac.jp/

URL: 

Published: 2013-06-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi