2012 Fiscal Year Research-status Report
Project/Area Number |
23560468
|
Research Institution | Tokyo Denki University |
Principal Investigator |
陶山 健仁 東京電機大学, 工学部, 教授 (50303011)
|
Keywords | マイクロホンアレー / 音源追尾 / 非線形最適化 |
Research Abstract |
平成24年度は平成23年度に開発した複数音源追尾手法であるPSOによる手法における無音区間からの復帰時の同一音源追尾問題の解決方法について検討するとともに,その実時間動作性能について主に検討した。PSOはMUSICスペクトルのような鋭いピークを有する評価関数のピーク点に対して強い指向性で探索を行なえる反面,複数音源の場合は発話復帰時のような過渡期に追尾対象である音源を捕らえることができないという潜在的な問題がある。例えば,2音源が同時に発話しているとき,一方の音源がいったん無音区間に入ってピークが消失し,再び発話状態になってピークが現れたとき,他の音源に対応するピークにパーティクルが集中し,発話状態に戻ったピークにはパーティクルが復帰できず,結果的に同一音源を追尾するように動作する。これを回避するため,パーティクルを複数群に分割し,各群で1つの音源を追尾するようにした。ただし,この場合でも複数の群が同一音源を追尾するため,群に対し,他の群が推定した音源方向を探索範囲に設定しないような制約条件を課し,同一音源の推定を禁止した。その結果,複数音源追尾が可能となった。実環境実験により,研究代表者が平成20年度に科学研究費若手研究(B)の補助を受けて開発したPAST-IPLS法と同等の性能をリアルタイムファクタ0.35で実現できたことを確認した。本手法は,音声のスパース性に基づく逐次更新ヒストグラムを用いた手法にも組み込むことが可能であるため,今後検討を進める予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
研究目的である実時間音源追尾システムの開発のうち,手法の検討ならびに性能評価については順調に目的が達成できている。しかしながら,実システムの開発のうち,とくにインタフェース部分については未検討であるため,その点において不十分であるといえる。ただし,インタフェース部分については現有の多チャネルADのドライバを所持しているため,その組み込みのみ検討を行なえば,あとはこれまでに開発してきたアルゴリズムがそのまま利用できる。以上を勘案して,やや遅れていると判断した。
|
Strategy for Future Research Activity |
平成25年度は実時間処理システムの構築を目指して,まずPCと多チャネルADのインタフェースの実装について検討する。その後,すでに開発済の検討手法を実装し,実時間動作ならびに追尾性能について検証する予定である。なお,研究実績概要でも述べた通り,現在検討中の手法は音声のスパース性に基づく逐次更新ヒストグラムによる手法との融合性が高いため,今後は逐次更新ヒストグラムによる手法の開発にも取り組む予定である。これについては研究計画の変更に該当する。ただし,実験装置などは同じであるため,科学研究費の利用用途には変更はない。
|
Expenditure Plans for the Next FY Research Funding |
平成25年度に取り組む実時間処理システムの構築のための多チャネルADは現有のものを利用するが,マイクロホンは現有のタイプがマイクロホンスタンドに設置するタイプであり,可搬性に欠けるため,小型のピンマイクロホンを20個程度購入予定である。また,それに伴い小型のマイクロホンアンプも購入予定である。また,最終年であるため,これまでの成果を国際会議等で公表予定である。これに関してはすでに4件の投稿を予定している。そのための旅費としても研究費を使用予定である。
|
Research Products
(7 results)