研究課題/領域番号 |
20K11874
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 京都産業大学 |
研究代表者 |
川村 新 京都産業大学, 情報理工学部, 教授 (60362646)
|
研究期間 (年度) |
2020-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
2023年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2022年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2021年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2020年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | 音源分離 / リアルタイム / ヒアラブル |
研究開始時の研究の概要 |
本応募課題における研究は,両耳に装着した2つのマイクロホンで,目的音源を識別し,それを抽出する,まさに聴覚の働きをリアルタイムに再現することである.提案法では音源分離を行い,各音源が目的音源か否かを判定する.この判定には,位相差スペクトルの分散を用いる.また,FPGAで試作機を製作し,提案法の実用化への見通しについても検証を行う.
|
研究実績の概要 |
本研究では,人間の両耳にマイクロホンを装着し,リアルタイムで音源分離を実行するシステムの開発を目指している.昨年度までに,実験環境の構築,アルゴリズムの簡略化,従来法との性能比較を実施し,さらに,提案法をMatlab上に実装し,オンライン動作することを確認した.オンライン動作確認では,目標とするヒアラブルデバイスに近い使用形態となるように,バイノーラルマイク(外側にマイク,内側にイヤホンが搭載された両耳デバイス)をユーザの耳に装着し,有線接続されたノートPCで音源分離を実行した.ユーザは,オンラインで分離音声を聞くことができる.今年度は,これまでの研究成果をまとめて,学術論文として発表した.また,被験者実験のアンケート結果を参考に,ユーザインターフェースのさらなる改良に着手した.ユーザインターフェースの改良では,中央最下部(原点)をユーザ位置に設定し,そこから音源方向(偏角)および音源距離(振幅)に音源クラスタを表示する,いわゆる極座標表示として設計した.これにより,ユーザと音源の位置関係が理解しやすくなった.さらに,音源クラスタの更新方法についても改善を行った.従来の音源分離法では,推定した音源クラスタが消失しない仕様となっていたため,音源の移動に対応できなかった.これを改善するため,一定時間アクティブにならない音源クラスタを消失させるように改善した.これにより,音源が移動した際に,それに追従して音源クラスタが更新されるようになった.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
これまでに開発した提案法をノートPC上のMatlabに実装し,ヒアラブルデバイスを想定したオンライン音源分離実験の実施,および音源分離効果の確認を行った.結果から,音源の到来方向の推定精度を昨年度よりも高めることに成功した.これらの研究成果を学術論文として発表した.さらに,ユーザインターフェースの改良と,一定時間アクティブにならない音源クラスタを消失させるようにシステムを改善した.この結果から,移動する音源に対しても提案法が有効に動作できるようになった.
|
今後の研究の推進方策 |
開発した音源分離システムのユーザインターフェースに対して被験者実験を行い,より満足度の高いシステムに発展させることを目標とする.また,クラスタリングの精度改善,分離音声の音質改善についても取り組む.さらに,提案法の実機への実装可能性についても検討するとともに,研究成果の発表も精力的に行っていく.
|