• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2009 Fiscal Year Annual Research Report

ユーザの発語行為解釈に基づくロボット音声対話インタフェース

Publicly Offered Research

Project AreaCyber Infrastructure for the Information-explosion Era
Project/Area Number 21013029
Research InstitutionKyoto University

Principal Investigator

駒谷 和範  Kyoto University, 情報学研究科, 助教 (40362579)

Keywords音声対話システム / 音声認識 / ロボット対話 / バージイン / 発話タイミング / 発語行為 / 音源分離 / 独立成分分析
Research Abstract

本研究では,実環境での頑健なロボット音声対話インタフェースの実現を目指して,音声認識結果として得られる発話内容以外に,発話タイミングや発話間の沈黙などの発語行為レベルの情報を併用して発話を解釈する枠組みを実現する.平成21年度は下記2点に取り組んだ.
(1) バージイン可能なシステムの構築とデータ収集:
実環境でのシステム発話に対するユーザの割り込み(バージイン)を可能とするために,独立成分分析(Independent Component Analysis;ICA)に基づく音源分離手法を利用し,これを入力として利用する音声対話システムを構築した.これを用いて,システムが選択肢を列挙し,ユーザがその中から一つを選択するというタスクを行う音声対話システムを構築した.タスクは,ニュースの読み上げとクイズの2種類であり,それぞれ20名から400発話と,300名から1184発話を収集した.このデータは,本研究課題における分析や評価に不可欠である.また2つの異なるタスクでデータを収集していることから,タスクに非依存な現象などの議論も行える.
(2) 選択肢の列挙に対するユーザの発語タイミングの分析とモデル化:
発話タイミングと音声認識結果の両方を用いてユーザの意図を解釈する方法を開発した.具体的にはシステムが列挙する選択肢をユーザが指定する際に,指示内容と発話タイミングの両方を確率で表現して統合し,ユーザの指示内容を同定できる.これによりユーザの指示対象の同定精度が向上することを,ニュース読み上げタスクの20名400発話を用いた評価実験により示した.

  • Research Products

    (11 results)

All 2010 2009

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (10 results)

  • [Journal Article] 複数の言語モデルと言語理解モデルによる音声理解の高精度化2010

    • Author(s)
      勝丸真樹, 中野幹生, 駒谷和範, 他4名
    • Journal Title

      電子情報通信学会論文誌 Vol.J93-D

    • Peer Reviewed
  • [Presentation] 複数の言語モデルと言語理解モデルによる音声理解手法のラピッドプロトタイピングへの適用2010

    • Author(s)
      勝丸真樹, 駒谷和範, 他5名
    • Organizer
      情報処理学会第72回全国大会,3U-2
    • Place of Presentation
      東京大学
    • Year and Date
      2010-03-09
  • [Presentation] バージイン許容音声対話におけるLSMによる許容発話範囲の拡張2010

    • Author(s)
      松山匡子, 駒谷和範, 高橋徹, 尾形哲也, 奥乃博
    • Organizer
      情報処理学会第72回全国大会,2ZN-2
    • Place of Presentation
      東京大学
    • Year and Date
      2010-03-08
  • [Presentation] 複数の言語モデルと言語理解モデルによるラピッドプロトタイピング向け音声理解2010

    • Author(s)
      勝丸真樹, 中野幹生, 駒谷和範, 他4名
    • Organizer
      情報処理学会音声言語情報処理研究会(SIG/SLP), 2010-SLP-80-5
    • Place of Presentation
      神戸市須磨温泉寿楼
    • Year and Date
      2010-02-12
  • [Presentation] Ranking Help Message Candidates Based on Robust Grammar Verification Results and Utterance History in Spoken Dialogue Systems2009

    • Author(s)
      Kazunori Komatani, 他4名
    • Organizer
      10th Annual SIGDIAL Meeting on Discourse and Dialogue
    • Place of Presentation
      London, UK
    • Year and Date
      2009-09-12
  • [Presentation] Improving Speech Understanding Accuracy with Limited Training Data Using Multiple Language Models and Multiple Understanding Models2009

    • Author(s)
      Masaki Katsumaru, Mikio Nakano, Kazunori Komatani, 他3名
    • Organizer
      Interspeech 2009
    • Place of Presentation
      Brighton, UK
    • Year and Date
      2009-09-10
  • [Presentation] Enabling A User To Specify An Item At Any Time During System Enumeration2009

    • Author(s)
      Kyoko Matsuyama, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.Okuno
    • Organizer
      Interspeech 2009
    • Place of Presentation
      Brighton, UK
    • Year and Date
      2009-09-08
  • [Presentation] 音声対話システムにおける文法検証結果と発話履歴に基づくヘルプメッセージ候補のランキング2009

    • Author(s)
      駒谷和範, 池田智志, 福林雄一朗, 尾形哲也, 奥乃博
    • Organizer
      情報処理学会音声言語情報処理研究会(SIG-SLP), 2009-SLP-77-12
    • Place of Presentation
      福島県飯坂温泉・飯坂ホテル聚楽
    • Year and Date
      2009-07-18
  • [Presentation] Adjusting Occurrence Probabilities of Automatically-Generated Abbreviated Words in Spoken Dialogue Systems2009

    • Author(s)
      Masaki Katsumaru, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.Okuno
    • Organizer
      IEA/AIE-2009, LNAI5579
    • Place of Presentation
      Tainan, Taiwan
    • Year and Date
      2009-06-25
  • [Presentation] A Speech Understanding Framework that Uses Multiple Language Models and Multiple Understanding Models2009

    • Author(s)
      Masaki Katsumaru, Mikio Nakano, Kazunori Komatani, 他3名
    • Organizer
      NAACL-HLT, Short Papers
    • Place of Presentation
      Boulder, CO, USA
    • Year and Date
      2009-06-01
  • [Presentation] バージイン発話タイミングモデルを導入した指示対象同定2009

    • Author(s)
      松山匡子, 駒谷和範, 武田龍, 尾形哲也, 奥乃博
    • Organizer
      情報処理学会音声言語情報処理研究会(SIG-SLP), 2009-SLP-76-14
    • Place of Presentation
      東京工業大学
    • Year and Date
      2009-05-22

URL: 

Published: 2011-06-16   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi