研究課題/領域番号 |
24220006
|
研究種目 |
基盤研究(S)
|
研究機関 | 京都大学 |
研究代表者 |
奥乃 博 京都大学, 情報学研究科, 教授 (60318201)
|
研究分担者 |
加賀美 聡 独立行政法人産業技術総合研究所, デジタルヒューマン工 学研究センター, 副研究セン ター長 (30344196)
糸山 克寿 京都大学, 情報学研究科, 助教 (60614451)
公文 誠 熊本大学, 自然科学研究科, 准教授 (70332864)
中臺 一博 東京工業大学, 情報理工学(系)研究科, 教授 (70436715)
|
研究期間 (年度) |
2012-05-31 – 2017-03-31
|
キーワード | ロボット聴覚 / 音環境理解 / AV-SLAM / 無人ヘリコプタ用音源定位 / 聖徳太子ロボット / ホース型レスキューロボット / 極限音環境 / 屋外音環境 |
研究概要 |
本研究課題では,既開発ロボット聴覚を多面的に発展させ,安全安心社会のための実環境音環境理解技術の確立を目的とする.初年度は,実験設備を充実させ,『多様な音の聞き分ける』要素技術の開発に取組んだ.主たる項目を示す. WP1: 【ロボット聴覚ソフトウエアHARK1.2の開発と公開】 ①3D音源定位,Windows版, 3月に京都大学で無料講習会実施. WP2: 【屋外への展開】②水平角・仰角ビームフォーミングに適した64ch低サイドローブマイクアレイ(MicArray)を設計・開発.屋外環境での定位誤差が二元角で共に6度程度の統計的三角測量による音源地図作成法開発.多層型レーザー距離センサによる統計的誤差最小化手法に基づく環境形状三次元モデル構築法開発.③クアドロコプタ(Qcoptor)搭載MicArrayを用い,逐次雑音推定機能を有した iGEVD(一般化特異値展開)-MUSIC 法を開発し,動的屋外雑音やQcoptorの自己雑音に対して,屋外飛行中で80%程度の音声検出正解率を確認.雑音相関行列の飛行条件での回帰化により雑音抑制を安定化.④屋外用に1.4kg以上のペイロードを有するQcoptorと,精密な位置・姿勢センサの開発,各種情報に同期した小型音響信号収録装置を開発.WP3: 【音一般への展開】⑤ノンパラメトリックベイズ(NP-Bayes)による高速多重基本周波数推定法,和音認識法の開発.⑥NP-Bayesによる音源数非依存のMUSIC音源定位技術の開発.⑦音光変換装置「カエルホタル」の高機能化により,2種カエルの合奏観測を隠岐島と豪州で検証.⑧NP-Bayesによる未知クラスを含む音源分類法を開発.WP4: 【極限環境への展開】⑨ 東北大学田所教授の支援を受け,ホース型ロボットの音による姿勢推定技術を開発. IROS-2012,RSJ, JSAI等で発表会を企画・運営.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
WP1: 【ロボット聴覚ソフトウエアHARKの展開】 ①市販MicArray4種(くらげ君,Kinect,PS-Eye,Microcone)のサポート,3D音源定位,Windows版等を含むHARK1.2を公開し,無料講習会を実施.SI2012優秀講演賞他3件を受賞.②両耳聴モジュールをHARK-Binaural に組込み. WP2: 【室内から屋外への展開】②水平角・仰角の音源定位が可能な64ch低サイドローブMicArrayを設計・開発し,屋外環境での定位誤差が二元角で共に6度程度という高性能を達成.多層型レーザー距離センサによる環境形状三次元モデル構築法を開発し,屋外での視聴覚情報統合による音源定位のための要素技術を開発.③クアドロコプタ(Qcoptor)搭載MicArrayを用い,屋外雑音や自己雑音に頑健な音源定位法を開発し,屋外飛行中での音声検出正解率を80%程度と従来法より50ポイント向上.④屋外用にペイロードの大きいQcoptorを開発し,位置・姿勢情報との同期機能を有したQcoptor搭載用小型音響信号収録装置を開発し,空中からの音取得のプラットフォームを構築. WP3: 【音声から音一般への展開】⑤NP-Bayesによる音楽情報処理,音源定位,音源分類法を開発.特に,バイオリン演奏音からの運指解析は音楽情報処理トップジャーナルに掲載.⑦音光変換装置「カエルホタル」の高機能化により,複数種のカエルの合奏観測を隠岐島と豪州で成功.カエルホタルは,Animal Behavior誌60周年記念論文で“no small technical feat!”と引用. WP4: 【実環境・極限環境への展開】⑧ホース型ロボットの試作により音を使った姿勢推定技術を開発し,今後音の可能性を実証. 国内外の学会集会で発表会と講習会を通じて成果の普及に努めた.
|
今後の研究の推進方策 |
2年目は『群ロボットによる聞き分け』のための総合技術の開発に着手.3チームに導入したQcoptorを使って空中からの音源定位に取組む.新たに田所教授を分担者に迎え,ホース型ロボットの音による姿勢推定技術にも取組む.各WPの予定を次に示す. WP1: ロボット聴覚ソフトウエアHARKの高機能化 ①様々な残響下での性能劣化抑制法の開発,②移動音源・自己生成音を用いた非同期MicArray群の同期校正技術の開発,③自己生成音の実時間抑制機能をHARKに実装.HARKを更改し,公開.無料講習会を国内外で開催. WP2: 室内から屋外への展開 ④Qcoptor搭載用高サンプリング音収録装置と伝送法の開発,⑤回帰によるQcoptor自己雑音抑制法の高性能化とiGSEV-MUSICとの統合した音源定位法の開発 ⑥視聴覚情報統合によるAV-SLAM技術の開発. WP3: 音声から音一般への展開 ⑦音源数非依存のNP-Bayes拡張版MUSIC法の性能評価と,HARKに実装.⑧カエルホタルの実フィールド(アメリカ東海岸とオーストラリア)での評価 ⑨人の感情表出モデルである提案中のSIRE (Speed, Intensity, iRregularity, and Extent)モデルのための音声モダリティ検出の実時間処理を実装し,トランスモーダル感情表現を実現.⑩近隣地域の方言を混ぜて話す話者の方言の混合使用率を推定し,同時に音声認識するNP-Bayesによる方言認識法を確立し,音声対話に応用. WP4: 実環境・極限環境への展開 ⑪ ホース型ロボットの試作と,ホースに配置したマイクロフォンによる自己生成音を使ったホース形状の推定法を確立,⑫音によるホース型ロボットの姿勢推定とジャイロによる指定推定の統合,ホース形状推定を基にした音源定位法の確立.さらに種々のロボット聴覚関係の研究会を企画・運営す
|