• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2010 年度 実績報告書

ユーザ・状況に適応的な音声対話による大規模情報の検索・提示

公募研究

研究領域情報爆発時代に向けた新しいIT基盤技術の研究
研究課題/領域番号 21013028
研究機関京都大学

研究代表者

河原 達也  京都大学, 学術情報メディアセンター, 教授 (00234104)

研究分担者 秋田 祐哉  京都大学, 学術情報メディアセンター, 助教 (90402742)
キーワード情報検索 / 音声対話 / インタラクション / 話し言葉 / 音声認識
研究概要

膨大かつ複雑な情報を誰もが理解・活用できるようにするには,人間と対話しながら,その人の意図や興味を推察することによって,的確な情報を検索し提示するシステムの実現が重要となる.現状の情報検索システムでは,キーワードにマッチする数多くの候補がディスプレイに表示されて,ユーザがそれらを1つずつチェックするというインタフェースとなっている.これに対して,音声対話によるリアルタイムのインタラクションを介して,ユーザの興味を喚起し,意図や選好を顕在化しながら,情報を検索・提示するプロアクティブなシステム「情報コンシェルジェ」の実現を目指して研究を行った.
前年度に引き続いて,Web上のニュースサイトの情報を元にして,ユーザの意図・嗜好に沿って,対話的に検索・提示するシステムを実装した.本システムの特徴は,述語項構造解析による情報抽出を基に情報検索・推薦を行う点である.これにより意味レベルのマッチングが可能になるが,解析自体やマッチングがうまくいかない場合に対応できる必要がある.また,情報検索や推薦に有用な述語項構造はドメインに依存する.そこで,当該ドメインの新聞記事コーパスから,情報抽出に用いる述語項構造のテンプレートを自動抽出するとともに,述語項の要素や用言の類似度を定義した.これにより,完全にマッチする情報がない場合でも,関連する情報を的確に提示できる機構を実現した.この枠組みは,人手で知識を記述しなくても,必要な知識が自動学習できるので,様々なドメインに適用できると考えられる.
また,人間どうしの自然なインタラクションであるポスター会話の分析を引き続き行った.特に今年度は,視線やうなずきなどの非言語情報も取り入れて,ユーザがいつどのような質問をするか予測するモデルを検討した.

  • 研究成果

    (5件)

すべて 2010

すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (1件) 図書 (1件)

  • [雑誌論文] Online unsupervised classification with model comparison in the Variational Bayes framework for voice activity detection.2010

    • 著者名/発表者名
      D.Cournapeau, S.Watanabe, A.Nakamura, T.Kawahara.
    • 雑誌名

      IEEE J.Selected Topics in Signal Processing

      巻: Vol.4, No.6 ページ: 1071-1083

    • 査読あり
  • [雑誌論文] Robust speech recognition based on dereverberation parameter optimization using acoustic model likelihood.2010

    • 著者名/発表者名
      R.Gomez, T.Kawahara.
    • 雑誌名

      IEEE Trans.Audio, Speech & Language Process.

      巻: Vol.18, No.7 ページ: 1708-1716

    • 査読あり
  • [雑誌論文] Statistical transformation of language and pronunciation models for spontaneous speech recognition.2010

    • 著者名/発表者名
      Y.Akita, T.Kawahara.
    • 雑誌名

      IEEE Trans.Audio, Speech & Language Process.

      巻: Vol.18, No.6 ページ: 1539-1549

    • 査読あり
  • [学会発表] Analysis on prosodic features of Japanese reactive tokens in poster conversations.2010

    • 著者名/発表者名
      T.Kawahara, Z.Q.Chang, K.Takanashi.
    • 学会等名
      Int'l Conf.Speech Prosody
    • 発表場所
      米国・シカゴ
    • 年月日
      2010-05-12
  • [図書] Julius : Open-source software toolkit for large vocabulary continuous speech recognition.2010

    • 著者名/発表者名
      T.Kawahara, A.Lee, K.Shikano.
    • 総ページ数
      305-308
    • 出版者
      Consideration Books

URL: 

公開日: 2012-07-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi