2009 年度実績報告書

ユーザの発語行為解釈に基づくロボット音声対話インタフェース

公募研究

研究領域	情報爆発時代に向けた新しいIT基盤技術の研究
研究課題/領域番号	21013029
研究機関	京都大学
研究代表者	駒谷和範京都大学, 情報学研究科, 助教 (40362579)
キーワード	音声対話システム / 音声認識 / ロボット対話 / バージイン / 発話タイミング / 発語行為 / 音源分離 / 独立成分分析
研究概要	本研究では,実環境での頑健なロボット音声対話インタフェースの実現を目指して,音声認識結果として得られる発話内容以外に,発話タイミングや発話間の沈黙などの発語行為レベルの情報を併用して発話を解釈する枠組みを実現する.平成21年度は下記2点に取り組んだ. (1) バージイン可能なシステムの構築とデータ収集: 実環境でのシステム発話に対するユーザの割り込み(バージイン)を可能とするために,独立成分分析(Independent Component Analysis;ICA)に基づく音源分離手法を利用し,これを入力として利用する音声対話システムを構築した.これを用いて,システムが選択肢を列挙し,ユーザがその中から一つを選択するというタスクを行う音声対話システムを構築した.タスクは,ニュースの読み上げとクイズの2種類であり,それぞれ20名から400発話と,300名から1184発話を収集した.このデータは,本研究課題における分析や評価に不可欠である.また2つの異なるタスクでデータを収集していることから,タスクに非依存な現象などの議論も行える. (2) 選択肢の列挙に対するユーザの発語タイミングの分析とモデル化: 発話タイミングと音声認識結果の両方を用いてユーザの意図を解釈する方法を開発した.具体的にはシステムが列挙する選択肢をユーザが指定する際に,指示内容と発話タイミングの両方を確率で表現して統合し,ユーザの指示内容を同定できる.これによりユーザの指示対象の同定精度が向上することを,ニュース読み上げタスクの20名400発話を用いた評価実験により示した.

研究成果
(11件)

すべて 2010 2009

すべて雑誌論文 (1件) (うち査読あり 1件) 学会発表 (10件)

[雑誌論文] 複数の言語モデルと言語理解モデルによる音声理解の高精度化2010
- 著者名/発表者名
  勝丸真樹, 中野幹生, 駒谷和範, 他4名
- 雑誌名
  
  電子情報通信学会論文誌 Vol.J93-D
- 査読あり
[学会発表] 複数の言語モデルと言語理解モデルによる音声理解手法のラピッドプロトタイピングへの適用2010
- 著者名/発表者名
  勝丸真樹, 駒谷和範, 他5名
- 学会等名
  情報処理学会第72回全国大会,3U-2
- 発表場所
  東京大学
- 年月日
  2010-03-09
[学会発表] バージイン許容音声対話におけるLSMによる許容発話範囲の拡張2010
- 著者名/発表者名
  松山匡子, 駒谷和範, 高橋徹, 尾形哲也, 奥乃博
- 学会等名
  情報処理学会第72回全国大会,2ZN-2
- 発表場所
  東京大学
- 年月日
  2010-03-08
[学会発表] 複数の言語モデルと言語理解モデルによるラピッドプロトタイピング向け音声理解2010
- 著者名/発表者名
  勝丸真樹, 中野幹生, 駒谷和範, 他4名
- 学会等名
  情報処理学会音声言語情報処理研究会(SIG/SLP), 2010-SLP-80-5
- 発表場所
  神戸市須磨温泉寿楼
- 年月日
  2010-02-12
[学会発表] Ranking Help Message Candidates Based on Robust Grammar Verification Results and Utterance History in Spoken Dialogue Systems2009
- 著者名/発表者名
  Kazunori Komatani, 他4名
- 学会等名
  10th Annual SIGDIAL Meeting on Discourse and Dialogue
- 発表場所
  London, UK
- 年月日
  2009-09-12
[学会発表] Improving Speech Understanding Accuracy with Limited Training Data Using Multiple Language Models and Multiple Understanding Models2009
- 著者名/発表者名
  Masaki Katsumaru, Mikio Nakano, Kazunori Komatani, 他3名
- 学会等名
  Interspeech 2009
- 発表場所
  Brighton, UK
- 年月日
  2009-09-10
[学会発表] Enabling A User To Specify An Item At Any Time During System Enumeration2009
- 著者名/発表者名
  Kyoko Matsuyama, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.Okuno
- 学会等名
  Interspeech 2009
- 発表場所
  Brighton, UK
- 年月日
  2009-09-08
[学会発表] 音声対話システムにおける文法検証結果と発話履歴に基づくヘルプメッセージ候補のランキング2009
- 著者名/発表者名
  駒谷和範, 池田智志, 福林雄一朗, 尾形哲也, 奥乃博
- 学会等名
  情報処理学会音声言語情報処理研究会(SIG-SLP), 2009-SLP-77-12
- 発表場所
  福島県飯坂温泉・飯坂ホテル聚楽
- 年月日
  2009-07-18
[学会発表] Adjusting Occurrence Probabilities of Automatically-Generated Abbreviated Words in Spoken Dialogue Systems2009
- 著者名/発表者名
  Masaki Katsumaru, Kazunori Komatani, Tetsuya Ogata, Hiroshi G.Okuno
- 学会等名
  IEA/AIE-2009, LNAI5579
- 発表場所
  Tainan, Taiwan
- 年月日
  2009-06-25
[学会発表] A Speech Understanding Framework that Uses Multiple Language Models and Multiple Understanding Models2009
- 著者名/発表者名
  Masaki Katsumaru, Mikio Nakano, Kazunori Komatani, 他3名
- 学会等名
  NAACL-HLT, Short Papers
- 発表場所
  Boulder, CO, USA
- 年月日
  2009-06-01
[学会発表] バージイン発話タイミングモデルを導入した指示対象同定2009
- 著者名/発表者名
  松山匡子, 駒谷和範, 武田龍, 尾形哲也, 奥乃博
- 学会等名
  情報処理学会音声言語情報処理研究会(SIG-SLP), 2009-SLP-76-14
- 発表場所
  東京工業大学
- 年月日
  2009-05-22

2009 年度 実績報告書

ユーザの発語行為解釈に基づくロボット音声対話インタフェース

研究代表者

駒谷 和範 京都大学, 情報学研究科, 助教 (40362579)

研究成果

[雑誌論文] 複数の言語モデルと言語理解モデルによる音声理解の高精度化2010

著者名/発表者名

雑誌名

[学会発表] 複数の言語モデルと言語理解モデルによる音声理解手法のラピッドプロトタイピングへの適用2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] バージイン許容音声対話におけるLSMによる許容発話範囲の拡張2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 複数の言語モデルと言語理解モデルによるラピッドプロトタイピング向け音声理解2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Ranking Help Message Candidates Based on Robust Grammar Verification Results and Utterance History in Spoken Dialogue Systems2009

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Improving Speech Understanding Accuracy with Limited Training Data Using Multiple Language Models and Multiple Understanding Models2009

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Enabling A User To Specify An Item At Any Time During System Enumeration2009

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 音声対話システムにおける文法検証結果と発話履歴に基づくヘルプメッセージ候補のランキング2009

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Adjusting Occurrence Probabilities of Automatically-Generated Abbreviated Words in Spoken Dialogue Systems2009

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] A Speech Understanding Framework that Uses Multiple Language Models and Multiple Understanding Models2009

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] バージイン発話タイミングモデルを導入した指示対象同定2009

著者名/発表者名

学会等名

発表場所

年月日

2009 年度実績報告書

駒谷和範京都大学, 情報学研究科, 助教 (40362579)