2005 年度実績報告書

対話状況に応じた自発的コミュニケーション機構の研究

研究課題

研究課題/領域番号	17300066
研究機関	早稲田大学
研究代表者	白井克彦早稲田大学, 理工学術院, 教授 (10063702)
研究分担者	榑松明早稲田大学, 理工学術院, 教授 (90251701) 誉田雅彰早稲田大学, スポーツ科学学術院, 教授 (90367095) 小林哲則早稲田大学, 理工学術院, 教授 (30162001) 菊池英明早稲田大学, 人間科学学術院, 助教授 (70308261) 大川茂樹千葉工業大学, 情報科学部, 助教授 (40306395)
キーワード	ロボット / 音声認識 / 感情発話 / 笑い声 / 音声対話 / 単語共起情報 / 動画像認識 / 人物姿勢認識
研究概要	本研究では、ユーザやシステムの状況に応じ自発的コミュニケーションを行うシステムの構築を目的として研究を行っている。まず、状況把握技術の研究としては、音響情報を用いたものと画像情報を用いたものの2種類の研究を行っている。音響情報では、音カテゴリの識別技術として、音声と音楽の混合信号中から両者を検出して識別する手法を提案し、その有効性を示した。また、音声中から、感情表現、特に笑い声を検出する技術の研究を行い、識別器にHMM、特徴料としてスペクトル包絡とFO成分を用いた手法を提案した。画像情報では、人物の動画像情報からその姿勢を識別する技術の研究を行った。ステレオカメラから取得した3次元の座標情報を用いることにより、従来より頑健な姿勢認識手法の提案を行った。提案システムの動作フェイズの一つとして、システムがユーザの状況を判断して対話を開始する局面が挙げられるが、ユーザフレンドリなシステムとしてその機能を実現するためには、画像情報から、ユーザが暇である、忙しいなどの状況を判断し、現在話しかけが行えるか否かを判断するための「状況判断モデル」の構築が必要である。そこで、本年度は、オフィスで作業する人物映像の視聴取実験を行い、人間はどのような要因から相手の状況を判断するのかを調べ、人物動作と状況判断の関係を明らかにした。また、システムの別の動作フェイズとして、ユーザとシステムが対話を行い、その対話を継続することでユーザから有用な情報を取得する局面が挙げられる。ユーザとの会話を継続するためには、ユーザを不快にさせない範囲での確認応答の生成が有効である。そのためには音声認識結果に対する信頼度の利用が有効だが、従来の音響モデル、言語モデルの利用に加え、対話の発話間の単語共起情報を用いることで信頼度の精度向上を図り、その有効性を示した。

研究成果
(5件)

すべて 2006 2005

すべて雑誌論文 (5件)

[雑誌論文] 時間的特徴を用いた音響信号中の音カテゴリ検出2006
- 著者名/発表者名
  谷口徹, 誉田雅彰, 大川茂樹, 白井克彦
- 雑誌名
  
  日本音響学会春季研究発表会講演論文集 2-4-16
  
  ページ: 293-294
[雑誌論文] 音声分析に基づく表情豊かな歌声合成2006
- 著者名/発表者名
  塩崎崇, 誉田雅彰, 白井克彦
- 雑誌名
  
  日本音響学会春季研究発表会講演論文集 2-2-9
  
  ページ: 707-708
[雑誌論文] Sinusoidal Segmentの時間的特徴を用いた音声・楽器音・歌声が混在した音響信号中の音カテゴリ検出2005
- 著者名/発表者名
  谷口徹, 安達了慈, 大川茂樹, 誉田雅彰, 白井克彦
- 雑誌名
  
  日本音響学会秋季研究発表会講演論文集 2-6-5
  
  ページ: 267-268
[雑誌論文] 分析合成系を用いた笑い声の音響的特徴の分析2005
- 著者名/発表者名
  芳賀寿昭, 誉田雅彰, 白井克彦
- 雑誌名
  
  日本音響学会秋季研究発表会講演論文集 1-6-9
  
  ページ: 239-240
[雑誌論文] Discrimination of Speech, Musical Instruments and Singing Voices Using the Temporal Patterns of Sinusoidal Segments in Audio Signals2005
- 著者名/発表者名
  T.Taniguchi, A.Adachi, S.Okawa, M.Honda, K.Shirai
- 雑誌名
  
  Proc. of Interspeech 2005
  
  ページ: 589-592

2005 年度 実績報告書

対話状況に応じた自発的コミュニケーション機構の研究

研究代表者

白井 克彦 早稲田大学, 理工学術院, 教授 (10063702)

研究成果

[雑誌論文] 時間的特徴を用いた音響信号中の音カテゴリ検出2006

著者名/発表者名

雑誌名

[雑誌論文] 音声分析に基づく表情豊かな歌声合成2006

著者名/発表者名

雑誌名

[雑誌論文] Sinusoidal Segmentの時間的特徴を用いた音声・楽器音・歌声が混在した音響信号中の音カテゴリ検出2005

著者名/発表者名

雑誌名

[雑誌論文] 分析合成系を用いた笑い声の音響的特徴の分析2005

著者名/発表者名

雑誌名

[雑誌論文] Discrimination of Speech, Musical Instruments and Singing Voices Using the Temporal Patterns of Sinusoidal Segments in Audio Signals2005

著者名/発表者名

雑誌名

2005 年度実績報告書

白井克彦早稲田大学, 理工学術院, 教授 (10063702)