• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

ユーザ・状況に適応的な音声対話による大規模情報の検索・提示

Publicly Offered Research

Project AreaCyber Infrastructure for the Information-explosion Era
Project/Area Number 21013028
Research Category

Grant-in-Aid for Scientific Research on Priority Areas

Allocation TypeSingle-year Grants
Review Section Science and Engineering
Research InstitutionKyoto University

Principal Investigator

河原 達也  京都大学, 学術情報メディアセンター, 教授 (00234104)

Co-Investigator(Kenkyū-buntansha) 秋田 祐哉  京都大学, 学術情報メディアセンター, 助教 (90402742)
Project Period (FY) 2009 – 2010
Project Status Completed (Fiscal Year 2010)
Budget Amount *help
¥10,900,000 (Direct Cost: ¥10,900,000)
Fiscal Year 2010: ¥5,300,000 (Direct Cost: ¥5,300,000)
Fiscal Year 2009: ¥5,600,000 (Direct Cost: ¥5,600,000)
Keywords情報検索 / 音声対話 / インタラクション / 話し言葉 / 音声認識
Research Abstract

膨大かつ複雑な情報を誰もが理解・活用できるようにするには,人間と対話しながら,その人の意図や興味を推察することによって,的確な情報を検索し提示するシステムの実現が重要となる.現状の情報検索システムでは,キーワードにマッチする数多くの候補がディスプレイに表示されて,ユーザがそれらを1つずつチェックするというインタフェースとなっている.これに対して,音声対話によるリアルタイムのインタラクションを介して,ユーザの興味を喚起し,意図や選好を顕在化しながら,情報を検索・提示するプロアクティブなシステム「情報コンシェルジェ」の実現を目指して研究を行った.
前年度に引き続いて,Web上のニュースサイトの情報を元にして,ユーザの意図・嗜好に沿って,対話的に検索・提示するシステムを実装した.本システムの特徴は,述語項構造解析による情報抽出を基に情報検索・推薦を行う点である.これにより意味レベルのマッチングが可能になるが,解析自体やマッチングがうまくいかない場合に対応できる必要がある.また,情報検索や推薦に有用な述語項構造はドメインに依存する.そこで,当該ドメインの新聞記事コーパスから,情報抽出に用いる述語項構造のテンプレートを自動抽出するとともに,述語項の要素や用言の類似度を定義した.これにより,完全にマッチする情報がない場合でも,関連する情報を的確に提示できる機構を実現した.この枠組みは,人手で知識を記述しなくても,必要な知識が自動学習できるので,様々なドメインに適用できると考えられる.
また,人間どうしの自然なインタラクションであるポスター会話の分析を引き続き行った.特に今年度は,視線やうなずきなどの非言語情報も取り入れて,ユーザがいつどのような質問をするか予測するモデルを検討した.

Report

(2 results)
  • 2010 Annual Research Report
  • 2009 Annual Research Report
  • Research Products

    (10 results)

All 2010 2009

All Journal Article (6 results) (of which Peer Reviewed: 6 results) Presentation (2 results) Book (1 results) Patent(Industrial Property Rights) (1 results)

  • [Journal Article] Online unsupervised classification with model comparison in the Variational Bayes framework for voice activity detection.2010

    • Author(s)
      D.Cournapeau, S.Watanabe, A.Nakamura, T.Kawahara.
    • Journal Title

      IEEE J.Selected Topics in Signal Processing

      Volume: Vol.4, No.6 Pages: 1071-1083

    • NAID

      120002598753

    • Related Report
      2010 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Robust speech recognition based on dereverberation parameter optimization using acoustic model likelihood.2010

    • Author(s)
      R.Gomez, T.Kawahara.
    • Journal Title

      IEEE Trans.Audio, Speech & Language Process.

      Volume: Vol.18, No.7 Pages: 1708-1716

    • NAID

      120002511317

    • Related Report
      2010 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Statistical transformation of language and pronunciation models for spontaneous speech recognition.2010

    • Author(s)
      Y.Akita, T.Kawahara.
    • Journal Title

      IEEE Trans.Audio, Speech & Language Process.

      Volume: Vol.18, No.6 Pages: 1539-1549

    • NAID

      120002511319

    • Related Report
      2010 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Bayes risk-based dialogue management for document retrieval system with speech interface.2010

    • Author(s)
      T.Misu, T.Kawahara.
    • Journal Title

      Speech Communication Vol.52, No.1

      Pages: 61-71

    • Related Report
      2009 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Effective prediction of errors by non-native speakers using decision tree for speech recognition-based CALL system.2009

    • Author(s)
      H.Wang, T.Kawahara.
    • Journal Title

      IEICE Trans. Vol.E92-D, No.121

      Pages: 2462-2468

    • NAID

      10026812661

    • Related Report
      2009 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Computer assisted language learning system based on dynamic question generation and error prediction for automatic speech recognition.2009

    • Author(s)
      H.Wang; C.J.Waple, T.Kawahara.
    • Journal Title

      Speech Communication Vol.51, No.10

      Pages: 995-1005

    • Related Report
      2009 Annual Research Report
    • Peer Reviewed
  • [Presentation] Analysis on prosodic features of Japanese reactive tokens in poster conversations.2010

    • Author(s)
      T.Kawahara, Z.Q.Chang, K.Takanashi.
    • Organizer
      Int'l Conf.Speech Prosody
    • Place of Presentation
      米国・シカゴ
    • Year and Date
      2010-05-12
    • Related Report
      2010 Annual Research Report
  • [Presentation] New perspectives on spoken language understanding : Doesmachine need to fully understand speech?2009

    • Author(s)
      T.Kawahara.
    • Organizer
      IEEE Workshop on Automatic Speech Recognition and Understanding (招待講演)
    • Place of Presentation
      イタリア・メラノ
    • Year and Date
      2009-12-16
    • Related Report
      2009 Annual Research Report
  • [Book] Julius : Open-source software toolkit for large vocabulary continuous speech recognition.2010

    • Author(s)
      T.Kawahara, A.Lee, K.Shikano.
    • Publisher
      Consideration Books
    • Related Report
      2010 Annual Research Report
  • [Patent(Industrial Property Rights)] 音響モデル学習装置、音声認識装置、及び音響モデル学習のためのコンピュータプログラム2009

    • Inventor(s)
      三村正人, 河原達也
    • Industrial Property Rights Holder
      京都大学
    • Industrial Property Number
      2009-094212
    • Filing Date
      2009-04-08
    • Related Report
      2009 Annual Research Report

URL: 

Published: 2009-04-01   Modified: 2018-03-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi