2011 Fiscal Year Annual Research Report

聞き手の反応に着目した音声会話の解析と生成

Research Project

Project/Area Number	22240013
Research Institution	Kyoto University
Principal Investigator	河原達也京都大学, 学術情報メディアセンター, 教授 (00234104)
Co-Investigator(Kenkyū-buntansha)	森信介京都大学, 学術情報メディアセンター, 准教授 (90456773) 秋田祐哉京都大学, 学術情報メディアセンター, 助教 (90402742) 角康之公立はこだて未来大学, システム情報科学部, 教授 (30362578)
Keywords	音声認識 / 自然言語解析 / 会話分析 / インタラクション / 話し言葉 / アーカイブ / エージェント
Research Abstract	話し言葉の音声認識に関する研究を進めながら、ニュースのように動的なコンテンツから話題・情報を収集して会話を生成するシステムを設計・実装した。話し言葉の音声認識では、言語モデルがドメインに関連する表現とフィラーや口語表現などの話し言葉特有の表現の両方をカバーすることが求められる。本研究では、単語・構文などの情報に基づくルールベースの話し言葉テキスト変換と、N-gramの統計的話し言葉変換を組み合わせて、書き言葉スタイルのテキストから話し言葉スタイルの言語モデルを構築する手法を検討した。学会講演音声を対象とした評価実験において、提案手法の効果の評価を行った。日々更新されるWebニュースなどのテキストに対して、述語項構造に着目した情報抽出を行い、それに基づいて情報検索・推薦を行う音声対話システムを構築した。まず、ドメインごとに有用な述語項構造パターンの抽出を行う指標を検討し、Naive Bayes法に基づく抽出が有効であることを示した。また、抽出された述語項構造に完全に一致するものがない場合でも情報推薦ができるように、前述の指標に基づいて述語項の優先度を決定し、さらに、要素・用言に関して関連度を定義することによって述語項どうしの類似度を計算した。評価実験において、典型的な従来手法であるBag-Of-Words (BOW)モデルと比較して、本手法がより的確に応答生成を行えることが示された。これに加えて、ユーザからの情報要求・発話がなくなった場合に、対話履歴中の述語項との類似度を利用してプロアクティブに情報提示を行う手法を提案した。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 音声認識、会話の分析・アノテーション、音声対話システム(会話エージェント)の各要素に関して、成果が出ており、論文発表も順調に行えている。
Strategy for Future Research Activity	各要素をさらに高度化していくとともに、それらの成果を統合したシステムの構築も進めていく予定である。

Research Products
(5 results)

All 2012 2011 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (1 results) Remarks (1 results)

[Journal Article] Bayesian learning of a language model from continuous speech2012
- Author(s)
  G.Neubig, M.Mimura, S.Mori, T.Kawahara
- Journal Title
  
  IEICE Trans
  
  Volume: Vol.E95-D,No.2 Pages: 614-625
- Peer Reviewed
[Journal Article] 述語項の類似度に基づく情報抽出・推薦を行う音声対話システム2011
- Author(s)
  吉野幸一郎, 森信介, 河原達也
- Journal Title
  
  情報処理学会論文誌
  
  Volume: Vol.52, No.12 Pages: 3386-3397
- Peer Reviewed
[Journal Article] 音声会話コンテンツにおける聴衆の反応に基づく音響イベントとホットスポットの検出2011
- Author(s)
  河原達也, 須見康平, 緒方淳, 後藤真孝
- Journal Title
  
  情報処理学会論文誌
  
  Volume: Vol.52, No.12 Pages: 3363-3373
- Peer Reviewed
[Presentation] New Transcription System using Automatic Sceech Recognition (ASR) in the Japanese Parliament (Diet)2011
- Author(s)
  Tatsuya Kawahara
- Organizer
  Intersteno IPRS
- Place of Presentation
  フランス・パリ
- Year and Date
  2011-07-14
[Remarks]
- URL
  http://www.ar.media.kyoto-u.ac.jp/

2011 Fiscal Year Annual Research Report

聞き手の反応に着目した音声会話の解析と生成

Principal Investigator

河原 達也 京都大学, 学術情報メディアセンター, 教授 (00234104)

Current Status of Research Progress

Reason

Research Products

[Journal Article] Bayesian learning of a language model from continuous speech2012

Author(s)

Journal Title

[Journal Article] 述語項の類似度に基づく情報抽出・推薦を行う音声対話システム2011

Author(s)

Journal Title

[Journal Article] 音声会話コンテンツにおける聴衆の反応に基づく音響イベントとホットスポットの検出2011

Author(s)

Journal Title

[Presentation] New Transcription System using Automatic Sceech Recognition (ASR) in the Japanese Parliament (Diet)2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Remarks]

URL

河原達也京都大学, 学術情報メディアセンター, 教授 (00234104)