研究課題/領域番号 |
23240023
|
研究機関 | 奈良先端科学技術大学院大学 |
研究代表者 |
猿渡 洋 奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (30324974)
|
研究分担者 |
戸田 智基 奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (90403328)
川波 弘道 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (80335489)
小野 順貴 国立情報学研究所, 大学共同利用機関等の部局等, 准教授 (80334259)
宮部 滋樹 筑波大学, システム情報工学研究科(系), 助教 (50598745)
牧野 昭二 筑波大学, システム情報工学研究科(系), 教授 (60396190)
|
研究期間 (年度) |
2011-04-01 – 2015-03-31
|
キーワード | 音声情報処理 / 統計的学習理論 |
研究概要 |
本研究では、新しい統計モデリングおよび高次統計量追跡による能動的声質制御技術の確立、およびその自律カスタムメイド音声コミュニケーション拡張システムへの応用に関して研究を行うことを目的とする。具体的な実証システムとして、高次統計量追跡による高品質ブラインド音源分離に基づく両耳補聴システムや、統計量追跡による声質制御可能な発声補助システムを開発し、その有効性を実証する。本年度は、以下の4項目に関して研究を遂行した。(1)実環境における聴覚障害者の音響環境を模擬するため、両耳補聴器に関する基礎データベースの収録を24年度に引き続き行った。ここでは、主に実環境騒音の収集に注力し、最終的に昨年度完備した20名分の頭部伝達関数と併せ、騒音化での両耳受聴が模擬できるシミュレータ環境を構築した。(2)両耳補聴器システムを確立するため、統計量追跡による非線形信号処理の最適化問題を数理的に議論した。特に、4次統計量不動点に基づく聴覚印象不動処理を独立成分分析アルゴリズムに導入し、実環境模擬データに対する分離評価を行った。特に本年は、ベイズ型音声振幅スペクトル推定における4次統計量不動点を世界で初めて発見し、それを応用したミュージカルノイズフリー音声強調法を開発した。(3)高精度処理に向け、補助関数型ベクトルICAや高次統計量型方向推定の数理を統計量追跡の観点から理論整備し、実環境模擬データベースを用いて評価を行った。(4)発話補助処理システムを確立するため、データベース間における発話のミスマッチを許容する声質変換処理を開発し、その評価を行った。上記の項目を実施することにより、本研究課題の基盤データ整備および基礎アルゴリズムの検討が完了した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
「高次統計量に基づく品質定量化」に関して、申請時計画には無かった「ベイズ推定における高次統計量不動点の発見」と「それを応用したミュージカルノイズフリー処理(品質劣化が一切起きない理論」を世界で初めて理論展開・実証した。特に前者は、通常行われるベイズ推定において不動点が存在しないことを証明し、推定における人工バイアスを加味することによって不動点現象が発芽することを世界で初めて示した。これにより、23年、24年までに開発したスペクトルサブトラクション(これは音声振幅スペクトルの最尤推定に相当)における高次統計量不動点理論と併せ、代表的な複数の統計推定法における高次統計量不動点の理論が整備された。
|
今後の研究の推進方策 |
音源分離関連の研究においては、既に計画を先取りしてマルチモーダル化・リアルタイム化に成功していることより、このテストベッドと高次統計量不動点の研究とを融合させ、最終年度に向けたシステム開発を推進する。補聴器応用としては、実際の人間頭部伝達関数の測定が完了したので、それを用いて個人性や環境依存性に関する実験評価を実施する。また、情報変換の例として、音声認識による評価も実施する。声質変換に関しては、現在までに確立した統計的声質変換モデルの精度向上を目指す。
|