ユーザ・状況に適応的な音声対話による大規模情報の検索・提示

公募研究

研究領域	情報爆発時代に向けた新しいIT基盤技術の研究
研究課題/領域番号	21013028
研究種目	特定領域研究
配分区分	補助金
審査区分	理工系
研究機関	京都大学
研究代表者	河原達也京都大学, 学術情報メディアセンター, 教授 (00234104)
研究分担者	秋田祐哉京都大学, 学術情報メディアセンター, 助教 (90402742)
研究期間 (年度)	2009 – 2010
研究課題ステータス	完了 (2010年度)
配分額 *注記	10,900千円 (直接経費: 10,900千円) 2010年度: 5,300千円 (直接経費: 5,300千円) 2009年度: 5,600千円 (直接経費: 5,600千円)
キーワード	情報検索 / 音声対話 / インタラクション / 話し言葉 / 音声認識
研究概要	膨大かつ複雑な情報を誰もが理解・活用できるようにするには,人間と対話しながら,その人の意図や興味を推察することによって,的確な情報を検索し提示するシステムの実現が重要となる.現状の情報検索システムでは,キーワードにマッチする数多くの候補がディスプレイに表示されて,ユーザがそれらを1つずつチェックするというインタフェースとなっている.これに対して,音声対話によるリアルタイムのインタラクションを介して,ユーザの興味を喚起し,意図や選好を顕在化しながら,情報を検索・提示するプロアクティブなシステム「情報コンシェルジェ」の実現を目指して研究を行った. 前年度に引き続いて,Web上のニュースサイトの情報を元にして,ユーザの意図・嗜好に沿って,対話的に検索・提示するシステムを実装した.本システムの特徴は,述語項構造解析による情報抽出を基に情報検索・推薦を行う点である.これにより意味レベルのマッチングが可能になるが,解析自体やマッチングがうまくいかない場合に対応できる必要がある.また,情報検索や推薦に有用な述語項構造はドメインに依存する.そこで,当該ドメインの新聞記事コーパスから,情報抽出に用いる述語項構造のテンプレートを自動抽出するとともに,述語項の要素や用言の類似度を定義した.これにより,完全にマッチする情報がない場合でも,関連する情報を的確に提示できる機構を実現した.この枠組みは,人手で知識を記述しなくても,必要な知識が自動学習できるので,様々なドメインに適用できると考えられる. また,人間どうしの自然なインタラクションであるポスター会話の分析を引き続き行った.特に今年度は,視線やうなずきなどの非言語情報も取り入れて,ユーザがいつどのような質問をするか予測するモデルを検討した.

報告書

(2件)

2010 実績報告書
2009 実績報告書

研究成果
(10件)

すべて 2010 2009

すべて雑誌論文 (6件) (うち査読あり 6件) 学会発表 (2件) 図書 (1件) 産業財産権 (1件)

[雑誌論文] Online unsupervised classification with model comparison in the Variational Bayes framework for voice activity detection.2010
- 著者名/発表者名
  D.Cournapeau, S.Watanabe, A.Nakamura, T.Kawahara.
- 雑誌名
  
  IEEE J.Selected Topics in Signal Processing
  
  巻: Vol.4, No.6 ページ: 1071-1083
- NAID
  120002598753
- 関連する報告書
  2010 実績報告書
- 査読あり
[雑誌論文] Robust speech recognition based on dereverberation parameter optimization using acoustic model likelihood.2010
- 著者名/発表者名
  R.Gomez, T.Kawahara.
- 雑誌名
  
  IEEE Trans.Audio, Speech & Language Process.
  
  巻: Vol.18, No.7 ページ: 1708-1716
- NAID
  120002511317
- 関連する報告書
  2010 実績報告書
- 査読あり
[雑誌論文] Statistical transformation of language and pronunciation models for spontaneous speech recognition.2010
- 著者名/発表者名
  Y.Akita, T.Kawahara.
- 雑誌名
  
  IEEE Trans.Audio, Speech & Language Process.
  
  巻: Vol.18, No.6 ページ: 1539-1549
- NAID
  120002511319
- 関連する報告書
  2010 実績報告書
- 査読あり
[雑誌論文] Bayes risk-based dialogue management for document retrieval system with speech interface.2010
- 著者名/発表者名
  T.Misu, T.Kawahara.
- 雑誌名
  
  Speech Communication Vol.52, No.1
  
  ページ: 61-71
- 関連する報告書
  2009 実績報告書
- 査読あり
[雑誌論文] Effective prediction of errors by non-native speakers using decision tree for speech recognition-based CALL system.2009
- 著者名/発表者名
  H.Wang, T.Kawahara.
- 雑誌名
  
  IEICE Trans. Vol.E92-D, No.121
  
  ページ: 2462-2468
- NAID
  10026812661
- 関連する報告書
  2009 実績報告書
- 査読あり
[雑誌論文] Computer assisted language learning system based on dynamic question generation and error prediction for automatic speech recognition.2009
- 著者名/発表者名
  H.Wang; C.J.Waple, T.Kawahara.
- 雑誌名
  
  Speech Communication Vol.51, No.10
  
  ページ: 995-1005
- 関連する報告書
  2009 実績報告書
- 査読あり
[学会発表] Analysis on prosodic features of Japanese reactive tokens in poster conversations.2010
- 著者名/発表者名
  T.Kawahara, Z.Q.Chang, K.Takanashi.
- 学会等名
  Int'l Conf.Speech Prosody
- 発表場所
  米国・シカゴ
- 年月日
  2010-05-12
- 関連する報告書
  2010 実績報告書
[学会発表] New perspectives on spoken language understanding : Doesmachine need to fully understand speech?2009
- 著者名/発表者名
  T.Kawahara.
- 学会等名
  IEEE Workshop on Automatic Speech Recognition and Understanding (招待講演)
- 発表場所
  イタリア・メラノ
- 年月日
  2009-12-16
- 関連する報告書
  2009 実績報告書
[図書] Julius : Open-source software toolkit for large vocabulary continuous speech recognition.2010
- 著者名/発表者名
  T.Kawahara, A.Lee, K.Shikano.
- 出版者
  Consideration Books
- 関連する報告書
  2010 実績報告書
[産業財産権] 音響モデル学習装置、音声認識装置、及び音響モデル学習のためのコンピュータプログラム2009
- 発明者名
  三村正人, 河原達也
- 権利者名
  京都大学
- 産業財産権番号
  2009-094212
- 出願年月日
  2009-04-08
- 関連する報告書
  2009 実績報告書

ユーザ・状況に適応的な音声対話による大規模情報の検索・提示

研究代表者

河原 達也 京都大学, 学術情報メディアセンター, 教授 (00234104)

10,900千円 (直接経費: 10,900千円)

報告書

研究成果

[雑誌論文] Online unsupervised classification with model comparison in the Variational Bayes framework for voice activity detection.2010

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] Robust speech recognition based on dereverberation parameter optimization using acoustic model likelihood.2010

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] Statistical transformation of language and pronunciation models for spontaneous speech recognition.2010

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] Bayes risk-based dialogue management for document retrieval system with speech interface.2010

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Effective prediction of errors by non-native speakers using decision tree for speech recognition-based CALL system.2009

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] Computer assisted language learning system based on dynamic question generation and error prediction for automatic speech recognition.2009

著者名/発表者名

雑誌名

関連する報告書

[学会発表] Analysis on prosodic features of Japanese reactive tokens in poster conversations.2010

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] New perspectives on spoken language understanding : Doesmachine need to fully understand speech?2009

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[図書] Julius : Open-source software toolkit for large vocabulary continuous speech recognition.2010

著者名/発表者名

出版者

関連する報告書

[産業財産権] 音響モデル学習装置、音声認識装置、及び音響モデル学習のためのコンピュータプログラム2009

発明者名

権利者名

産業財産権番号

出願年月日

関連する報告書

河原達也京都大学, 学術情報メディアセンター, 教授 (00234104)