2012 Fiscal Year Annual Research Report
高次統計量追跡による自律カスタムメイド音コミュニケーション拡張システムの研究
Project/Area Number |
23240023
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
猿渡 洋 奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (30324974)
|
Co-Investigator(Kenkyū-buntansha) |
戸田 智基 奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (90403328)
鹿野 清宏 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00263426)
川波 弘道 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (80335489)
小野 順貴 国立情報学研究所, 情報学プリンシプル, 准教授 (80334259)
宮部 滋樹 筑波大学, システム情報工学研究科(系), 助教 (50598745)
牧野 昭二 筑波大学, システム情報工学研究科(系), 教授 (60396190)
|
Project Period (FY) |
2011-04-01 – 2015-03-31
|
Keywords | 音声情報処理 / 統計的学習理論 |
Research Abstract |
本研究では、新しい統計モデリングおよび高次統計量追跡による能動的声質制御技術の確立、およびその自律カスタムメイド音声コミュニケーション拡張システムへの応用に関して研究を行うことを目的とする。具体的な実証システムとして、高次統計量追跡による高品質ブラインド音源分離に基づく両耳補聴システムや、統計量追跡による声質制御可能な発声補助システムを開発し、その有効性を実証する。 本年度は、以下の4項目に関して研究を遂行した。 (1)実環境における聴覚障害者の音響環境を模擬するため、両耳補聴器に関する基礎データベースの収録を23年度に引き続き行った。最終的に20名分の頭部伝達関数が模擬できるデータベースを構築した。 (2)両耳補聴器の基礎アルゴリズムを確立するため、統計量追跡による非線形信号処理の最適化問題を数理的に議論した。特に、4次統計量不動点に基づく聴覚印象不動処理を独立成分分析アルゴリズムに導入し、実環境模擬データに対する分離評価を行った。また、市販のKinectセンサ上に画像併用型リアルタイム実装し、実環境でのリアルタイム動作の確認を行った。 (3)高精度処理に向け、補助関数型ベクトルICAや高次統計量型方向推定の数理を統計量追跡の観点から理論整備した。 (4)発話補助処理の基礎を確立するため、データベース間における発話のミスマッチを許容する声質変換処理を導出した。また、NAMセンサの高精度化を目指し、6チャネルNAMの統合信号処理を開発した。 上記の項目を実施することにより、本研究課題の基盤データ整備および基礎アルゴリズムの検討が完了した。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
「独立成分分析アルゴリズムのリアルタイム実装」に関して、計画には無かった「画像を含めたマルチモーダルシステム」へ拡張し、評価実験を行った。
|
Strategy for Future Research Activity |
音源分離関連の研究においては、既に計画を先取りしてマルチモーダル化・リアルタイム化に成功していることより、このテストベッドを有効に活用してアルゴリズム開発を推進する。補聴器応用としては、実際の人間頭部伝達関数の測定が完了したので、それを用いて個人性や環境依存性に関する実験評価を実施する。また、情報変換の例として、音声認識による評価も実施する。声質変換に関しては、現在までに確立した統計的声質変換モデルの精度向上を目指す。
|
Research Products
(7 results)