2006 年度実績報告書

対話状況に応じた自発的コミュニケーション機構の研究

研究課題

研究課題/領域番号	17300066
研究機関	早稲田大学
研究代表者	白井克彦早稲田大学, 理工学術院, 教授 (10063702)
研究分担者	榑松明早稲田大学, 理工学術院, 教授 (90251701) 誉田雅彰早稲田大学, スポーツ科学学術院, 教授 (90367095) 小林哲則早稲田大学, 理工学術院, 教授 (30162001) 菊池英明早稲田大学, 人間科学学術院, 助教授 (70308261) 大川茂樹千葉工業大学, 情報科学部, 助教授 (40306395)
キーワード	ロボット / 音声認識 / 感情発話 / 笑い声 / 音声対話 / 単語共起情報 / 動画像認識 / 人物姿勢認識
研究概要	本研究は,対話を自発的に開始・継続・終了する対話システムの構築を目的としている. その実現には,システム側から能動的にインタラクションを行う機構が必要であり,具体的には,(1)対話状況・環境把握の技術,(2)自発的コミュニケーション制御モデル,(3)音声の生成と動作表現の技術という3種類の技術の確立が求められる. まず,(1)に関しては,環境雑音やBGMの中から,音声を検出する技術の研究を行った.音響信号をspectral sequenceという単位へ分解することにより実現する.本年は特に,spectral sequence抽出に必要なspectral tracking技術を発展させた.また,対話の開始タイミングを諮るため,対話対象者の画像情報から話しかけてよいか否かを判断する,話しかけ判断モデルの検討を行った.画像特徴量は首の付け根・背中・腰・肩・肘・手首・手の甲の3次元座標から抽出した間接の角度,角速度を用いた.識別器にはGMMを用い,フレーム単位で75%程度の正解認識率を得た. (2)に関しては,対話継続のためのコミュニケーションモデルの検討を行った.本研究で想定している対話タスクにおいては,インタビュー形式の対話が必要であり,これは従来のタスク遂行型対話と異なり,ユーザがシステムからの質問内容に関して自由に発話するところが異なる.本年は,ユーザにいかに多くの情報を発話させるかを評価基準にして,インタビュー対話に有効なロボットの非言語情報の分析を行った.その結果,言葉による相づちと動作による首のうなずき,かしげが有効であることが分かった. (3)に関しては,機械による感情表現を目的として,音声の感情表現である笑い声の分析と合成方法の検討を行っている.本年は笑い声の中でも,特に喋り笑いの分析と合成を行い,通常の音声を喋り笑いに変換する方法を提案した.

研究成果
(13件)

すべて 2007 2006

すべて雑誌論文 (11件) 産業財産権 (2件)

[雑誌論文] Instantaneous Phase Analysis Using Artificial Neural Networks for Automatic Speech Recognition,2007
- 著者名/発表者名
  Yotaro Kubo, Shigeki Okawa, Akira Kurematsu, Katsuhiko Shirai
- 雑誌名
  
  Proc. NCSP'07, Shanghai, China,
  
  ページ: 321-324
[雑誌論文] Automatic music selection method adapted to the user's preference,2007
- 著者名/発表者名
  Kentaro Hikosaka, Toru Taniguchi, Yotaro Kubo, Masaaki Honda and
- 雑誌名
  
  Proc. NCSP'07, Shanghai, China,
  
  ページ: 477-480
[雑誌論文] 発話間単語共起関係に基づく補正信頼度を用いた音声認識2006
- 著者名/発表者名
  松本宗也, 谷口徹, 白井克彦, 榑松明
- 雑誌名
  
  言語処理学会第12回年次大会 (音声言語・対話) NLP2006(CD-ROM)(口頭発表)
[雑誌論文] 声質分析に基づく表情豊かな歌声合成2006
- 著者名/発表者名
  塩崎崇, 誉田雅彰, 白井克彦
- 雑誌名
  
  日本音響学会春季研究発表会講演論文集 2-2-9
  
  ページ: 707-708
[雑誌論文] 時間的特徴を用いた音響信号中の音カテゴリ検出2006
- 著者名/発表者名
  谷口徹, 誉田雅彰, 大川茂樹, 白井克彦
- 雑誌名
  
  日本音響学会春季研究発表会講演論文集 2-4-16
  
  ページ: 293-294
[雑誌論文] SPECTRAL FREQUENCY TRACKING FOR CLASSIFYING AUDIO SIGNALS2006
- 著者名/発表者名
  Toru Taniguchi, Mikio Tohyama, Katsuhiko Shirai
- 雑誌名
  
  Proc. of 2006 IEEE International Symposium on Signal Processing and Information Technology
  
  ページ: 300-303
[雑誌論文] ロボットの状況判断モデル構築のための人物動作分析2006
- 著者名/発表者名
  松井和教, 市川貴浩, 誉田雅彰, 村上真, 白井克彦
- 雑誌名
  
  FIT2006, (CD-ROM)
  
  ページ: 375-376
[雑誌論文] ディジタルアクタシステム実現のための感情表出モデルの構築2006
- 著者名/発表者名
  島尻絵里奈, 松井和教, 板野貴之, 村上真, 誉田雅彰, 白井克彦
- 雑誌名
  
  FIT2006, (CD-ROM)
  
  ページ: 235-236
[雑誌論文] デジタルカメラワークによるサッカー映像生成2006
- 著者名/発表者名
  鈴木健司, 誉田雅彰, 村上真, 白井克彦
- 雑誌名
  
  FIT2006. (CD-ROM)
  
  ページ: 137-138
[雑誌論文] 自在な笑い声・喋り笑いを生成するい声フィルタの構築2006
- 著者名/発表者名
  芳賀寿昭, 誉田雅彰, 白井克彦
- 雑誌名
  
  日本音響学会秋季研究発表会講演論文集
  
  ページ: 173-174
[雑誌論文] ユーザの嗜好に適応させた選曲システムの提案2006
- 著者名/発表者名
  彦坂健太郎, 谷口撤, 誉田雅彰, 白井克彦
- 雑誌名
  
  情報処理学会研究報告 2006-MUIS
  
  ページ: 19-24
[産業財産権] 音声処理装置及び音声認識装置2007
- 発明者名
  白井克彦
- 権利者名
  早稲田大学
- 産業財産権番号
  特許
- 出願年月日
  2007-03-01
[産業財産権] 音楽再生システム2007
- 発明者名
  白井克彦
- 権利者名
  早稲田大学
- 産業財産権番号
  特許
- 出願年月日
  2007-03-01

2006 年度 実績報告書

対話状況に応じた自発的コミュニケーション機構の研究

研究代表者

白井 克彦 早稲田大学, 理工学術院, 教授 (10063702)

研究成果

[雑誌論文] Instantaneous Phase Analysis Using Artificial Neural Networks for Automatic Speech Recognition,2007

著者名/発表者名

雑誌名

[雑誌論文] Automatic music selection method adapted to the user's preference,2007

著者名/発表者名

雑誌名

[雑誌論文] 発話間単語共起関係に基づく補正信頼度を用いた音声認識2006

著者名/発表者名

雑誌名

[雑誌論文] 声質分析に基づく表情豊かな歌声合成2006

著者名/発表者名

雑誌名

[雑誌論文] 時間的特徴を用いた音響信号中の音カテゴリ検出2006

著者名/発表者名

雑誌名

[雑誌論文] SPECTRAL FREQUENCY TRACKING FOR CLASSIFYING AUDIO SIGNALS2006

著者名/発表者名

雑誌名

[雑誌論文] ロボットの状況判断モデル構築のための人物動作分析2006

著者名/発表者名

雑誌名

[雑誌論文] ディジタルアクタシステム実現のための感情表出モデルの構築2006

著者名/発表者名

雑誌名

[雑誌論文] デジタルカメラワークによるサッカー映像生成2006

著者名/発表者名

雑誌名

[雑誌論文] 自在な笑い声・喋り笑いを生成するい声フィルタの構築2006

著者名/発表者名

雑誌名

[雑誌論文] ユーザの嗜好に適応させた選曲システムの提案2006

著者名/発表者名

雑誌名

[産業財産権] 音声処理装置及び音声認識装置2007

発明者名

権利者名

産業財産権番号

出願年月日

[産業財産権] 音楽再生システム2007

発明者名

権利者名

産業財産権番号

出願年月日

2006 年度実績報告書

白井克彦早稲田大学, 理工学術院, 教授 (10063702)