複数話者の音声コミュニケーションの意図・状況理解

研究課題

研究課題/領域番号	16016250
研究種目	特定領域研究
配分区分	補助金
審査区分	理工系
研究機関	京都大学
研究代表者	河原達也京都大学, 学術情報メディアセンター, 教授 (00234104)
研究分担者	岡田美智男 ATR, ネットワーク情報学研究所, 室長
研究期間 (年度)	2004 – 2005
研究課題ステータス	完了 (2005年度)
配分額 *注記	9,300千円 (直接経費: 9,300千円) 2005年度: 4,700千円 (直接経費: 4,700千円) 2004年度: 4,600千円 (直接経費: 4,600千円)
キーワード	音声情報処理 / 音声認識 / 意図理解 / 音声対話システム / 協調的応答 / ユーザモデル / ユーザーモデル
研究概要	人間と共生する機械を実現するためには、システムがユーザのモデルを知覚し、それに応じて適応的に行動することが重要であると考えられる。本研究ではまず、音声対話によるインタフェースにおいて、協調的な応答を生成するためのユーザモデルについて検討を進めてきた。具体的には、システムに対する習熟度、タスクドメインに関する知識レベル、性急度の3つのユーザモデルを導入し、それに応じて対話制御を行う戦略を提案した。京都市バス運行情報案内システム(現在試験運用中:075-326-3116)において実装・評価を行った結果、各ユーザに適応した協調的応答が、習熟したユーザに対する対話時間を増加させることなく、初心者に対して適切なガイダンスとなることが示された。本研究で用いているユーザモデルは自動判別を行うが、そのための特徴として音声認識結果に含まれる意味情報以外に、発話間間隔やバージインの有無などの音声対話特有の特徴も用いている。特に、習熟度と性急度の学習・判別に用いる特徴はドメイン知識に依存していないため、これらのユーザデルは他のドメインにも応用できる汎用的なものである。ただし、対話制御については人手で規則を記述する必要があり、大規模なドメインやモデルへの適用が困難であった。そこで次に、ユーザや状況のモデルに基づいて、プランニングにより対話制御・応答生成を行う枠組みを考え、このプランニング(プランを動的に選択する機構)を機械学習により行うことを研究した。プランはドメインプランと発話プランの2階層からなり、ドメインプランを決定することで次に提供する情報内容を決定し、発話プランを決定して具体的な応答を生成する。これらのプランは、前記のようなユーザ・状況のモデルをパラメータとする線形の評価関数で規定される。ロールプレイ形式で行う模擬対話サンプルによりこの学習を行うことにより、ユーザに適応した対話プランの選択を実現することができた。

報告書

(2件)

2005 実績報告書
2004 実績報告書

研究成果
(14件)

すべて 2006 2005 2004

すべて雑誌論文 (12件) 図書 (1件) 産業財産権 (1件)

[雑誌論文] Verification of speech recognition results incorporating in-domain confidence and discourse coherence measures.2006
- 著者名/発表者名
  I.R.Lane, T.Kawahara.
- 雑誌名
  
  IEICE Trans. Vol.E89-D・No.3
  
  ページ: 931-938
- NAID
  110004719366
- 関連する報告書
  2005 実績報告書
[雑誌論文] Trigger-based language model adaptation for automatic transcription of panel discussions.2006
- 著者名/発表者名
  C.Troncoso, T.Kawahara.
- 雑誌名
  
  IEICE Trans. Vol.E89-D・No.3
  
  ページ: 1024-1031
- NAID
  110004719377
- 関連する報告書
  2005 実績報告書
[雑誌論文] Speaker model selection based on Bayesian information criterion applied to unsupervised speaker indexing.2005
- 著者名/発表者名
  M.Nishida, T.Kawahara.
- 雑誌名
  
  IEEE Trans.Speech & Audio Process. Vol.13.No.4
  
  ページ: 583-592
- NAID
  120002511373
- 関連する報告書
  2005 実績報告書
[雑誌論文] User modeling in spoken dialogue systems to generate flexible guidance.2005
- 著者名/発表者名
  K.Komatani, S.Ueno, T.Kawahara, H.G.Okuno.
- 雑誌名
  
  User Modeling and User-Adapted Interaction. Vol.15・No.1
  
  ページ: 169-183
- 関連する報告書
  2005 実績報告書
[雑誌論文] 話し言葉音声認識のための汎用的な統計的発音変動モデル.2005
- 著者名/発表者名
  秋田祐哉, 河原達也.
- 雑誌名
  
  電子情報通信学会論文誌 Vol.J88-DII・No.9
  
  ページ: 1780-1789
- NAID
  110003224132
- 関連する報告書
  2005 実績報告書
[雑誌論文] 日本語話し言葉の係り受け解析と文境界推定の相互作用による高精度化.2005
- 著者名/発表者名
  下岡和也, 内元清貴, 河原達也, 井佐原均
- 雑誌名
  
  自然言語処理 Vol.12・No.3
  
  ページ: 3-17
- NAID
  10016629478
- 関連する報告書
  2005 実績報告書
[雑誌論文] 音声対話によるソフトウェアサポートタスクのための効率的な確認戦略2005
- 著者名/発表者名
  翠輝久, 駒谷和範, 清田陽司, 河原達也
- 雑誌名
  
  電子情報通信学会論文誌 J88-DII,3
  
  ページ: 499-508
- NAID
  110003203199
- 関連する報告書
  2004 実績報告書
[雑誌論文] Dialogue speech recognition by combining hierarchical topic classification and language model switching2005
- 著者名/発表者名
  I.R.Lane, T.Kawahara, T.Matsui, S.Nakamura
- 雑誌名
  
  IEICE Trans. E88-D,3
  
  ページ: 446-454
- NAID
  110003214205
- 関連する報告書
  2004 実績報告書
[雑誌論文] 音声対話システムにおける適応的な応答生成を行うためのユーザモデル2004
- 著者名/発表者名
  駒谷和範, 上野晋一, 河原達也, 奥乃博
- 雑誌名
  
  電子情報通信学会論文誌 J87-DII,10
  
  ページ: 1921-1928
- NAID
  110003171015
- 関連する報告書
  2004 実績報告書
[雑誌論文] Automatic indexing of lecture presentations using unsupervised learning of presumed discourse markers2004
- 著者名/発表者名
  T.Kawahara, M.Hasegawa, K.Shitaoka, T.Kitade, H.Nanjo
- 雑誌名
  
  IEEE Trans. Speech & Audio Processing 12,4
  
  ページ: 409-419
- NAID
  120002511374
- 関連する報告書
  2004 実績報告書
[雑誌論文] 話し言葉による音声対話システム2004
- 著者名/発表者名
  河原達也
- 雑誌名
  
  情報処理 45,10
  
  ページ: 1027-1031
- 関連する報告書
  2004 実績報告書
[雑誌論文] Example-based training of dialogue planning incorporating user and situation models2004
- 著者名/発表者名
  S.Ueno, I.R.Lane, T.Kawahara
- 雑誌名
  
  Proc. ICSLP
  
  ページ: 2837-2840
- 関連する報告書
  2004 実績報告書
[図書] Spoken Language Systems.2005
- 著者名/発表者名
  Seiichi Nakagawa, Michio Okada, Tatsuya Kawahara, editors.
- 総ページ数
  347
- 出版者
  Ohmsha/IOS Press
- 関連する報告書
  2005 実績報告書
[産業財産権] 発話区間検出装置、そのためのコンピュータプログラム及び記録媒体2005
- 発明者名
  河原達也, 木田祐介
- 権利者名
  京都大学
- 産業財産権番号
  2005-197804
- 出願年月日
  2005-07-06
- 関連する報告書
  2005 実績報告書

複数話者の音声コミュニケーションの意図・状況理解

研究代表者

河原 達也 京都大学, 学術情報メディアセンター, 教授 (00234104)

9,300千円 (直接経費: 9,300千円)

報告書

研究成果

[雑誌論文] Verification of speech recognition results incorporating in-domain confidence and discourse coherence measures.2006

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] Trigger-based language model adaptation for automatic transcription of panel discussions.2006

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] Speaker model selection based on Bayesian information criterion applied to unsupervised speaker indexing.2005

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] User modeling in spoken dialogue systems to generate flexible guidance.2005

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 話し言葉音声認識のための汎用的な統計的発音変動モデル.2005

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] 日本語話し言葉の係り受け解析と文境界推定の相互作用による高精度化.2005

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] 音声対話によるソフトウェアサポートタスクのための効率的な確認戦略2005

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] Dialogue speech recognition by combining hierarchical topic classification and language model switching2005

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] 音声対話システムにおける適応的な応答生成を行うためのユーザモデル2004

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] Automatic indexing of lecture presentations using unsupervised learning of presumed discourse markers2004

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] 話し言葉による音声対話システム2004

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Example-based training of dialogue planning incorporating user and situation models2004

著者名/発表者名

雑誌名

関連する報告書

[図書] Spoken Language Systems.2005

著者名/発表者名

総ページ数

出版者

関連する報告書

[産業財産権] 発話区間検出装置、そのためのコンピュータプログラム及び記録媒体2005

発明者名

権利者名

産業財産権番号

出願年月日

関連する報告書

河原達也京都大学, 学術情報メディアセンター, 教授 (00234104)