2009 年度自己評価報告書

音環境理解に基づくロボット聴覚の構築

研究課題

研究課題/領域番号	19100003
研究種目	基盤研究(S)
配分区分	補助金
研究分野	知覚情報処理・知能ロボティクス
研究機関	京都大学
研究代表者	奥乃博京都大学, 大学院・情報学研究科, 教授 (60318201)
研究期間 (年度)	2007 – 2011
キーワード	ロボット聴覚 / 聖徳太子ロボット / 音源定位 / 音源分離 / 音声認識
研究概要	ロボット聴覚の最下位の機能とは「ロボット自身の耳」から入力される音の処理である. (1)複数同時発話を聞き分け,裁いたという聖徳太子のような聴覚機能を実現するために,音環境理解の3要素技術である音源定位,音源分離,分離音認識の適用限界を明確にした汎用のロボット聴覚設計原理を確立.また,階層的視聴覚情報統合による複数移動話者の定位・分離・認識技術を確立する. (2)人の音環境理解及び聴覚メカニズムを解明するために,音声模倣を規範とした音素獲得過程を特に,音素集合を与えない連続音響信号からの音素獲得のモデル化を行う. (3)ヒューマノイドロボットにおける音声対話機能,特に,ユーザビリティの高い音声対話を実現するには,ユーザが自由なタイミングで割り込んで(バージイン)発話でき,かつ自由な表現で発話できる枠組みが不可欠である.前者は自己発話抑制機能による枠組みを,後者はシステムが解釈できな想定外発話への対処法を開発する.

研究成果
(7件)

すべて 2010 2009 2008 その他

すべて雑誌論文 (5件) (うち査読あり 4件) 備考 (2件)

[雑誌論文] Design and Implementation of Robot Audition System "HARK"2010
- 著者名/発表者名
  K. Nakadai, H. G. Okuno, H. Nakajima, Y. Hasegawa, H. Tsujino
- 雑誌名
  
  Advanced Robotics, in print (VSP and RSJ)
- 査読あり
[雑誌論文] 残響下でのバージイン発話認識のための多入力独立成分分析を応用したロボット聴覚2009
- 著者名/発表者名
  武田龍, 中臺一博, 駒谷和範, 尾形哲也, 奥乃博
- 雑誌名
  
  日本ロボット学会誌 27:7
  
  ページ: 782-792
- 査読あり
[雑誌論文] 人工神経回路モデルと声道物理モデルを用いた母音模倣モデルに基づく音素獲得シミュレーション2009
- 著者名/発表者名
  神田尚, 尾形哲也, 駒谷和範, 奥乃博
- 雑誌名
  
  日本ロボット学会誌 27:7
  
  ページ: 802-813
- 査読あり
[雑誌論文] Human Tracking System Integrating Sound and Face Localization using EM Algorithm in Real Environments2009
- 著者名/発表者名
  H-D. Kim, K. Komatani, T. Ogata, H. G. Okuno
- 雑誌名
  
  Advanced Robotics 23:6
  
  ページ: 629-653
- 査読あり
[雑誌論文] A Robot Listens to Music and Counts Its Beats Aloud by Separating Music from Counting Voice2008
- 著者名/発表者名
  T. Mizumoto, R. Takeda, K. Yoshii, K. Komatani, T. Ogata, H. G. Okuno
- 雑誌名
  
  Proc. of IEEE/RSJ International Conf. on Intelligent Robots & Systems (NTF Award Finalist)
  
  ページ: 1538-1543
[備考] ホームページ
- URL
  http://winnie.kuis.kyoto-u.ac.jp/
[備考] ロボット聴覚ソフトウエアHARK
- URL
  http://winnie.kuis.kyoto-u.ac.jp/HARK/

2009 年度 自己評価報告書

音環境理解に基づくロボット聴覚の構築

研究代表者

奥乃 博 京都大学, 大学院・情報学研究科, 教授 (60318201)

研究成果

[雑誌論文] Design and Implementation of Robot Audition System "HARK"2010

著者名/発表者名

雑誌名

[雑誌論文] 残響下でのバージイン発話認識のための多入力独立成分分析を応用したロボット聴覚2009

著者名/発表者名

雑誌名

[雑誌論文] 人工神経回路モデルと声道物理モデルを用いた母音模倣モデルに基づく音素獲得シミュレーション2009

著者名/発表者名

雑誌名

[雑誌論文] Human Tracking System Integrating Sound and Face Localization using EM Algorithm in Real Environments2009

著者名/発表者名

雑誌名

[雑誌論文] A Robot Listens to Music and Counts Its Beats Aloud by Separating Music from Counting Voice2008

著者名/発表者名

雑誌名

[備考] ホームページ

URL

[備考] ロボット聴覚ソフトウエアHARK

URL

2009 年度自己評価報告書

奥乃博京都大学, 大学院・情報学研究科, 教授 (60318201)