1996 Fiscal Year Annual Research Report
Project/Area Number |
07308026
|
Research Institution | Nagoya University |
Principal Investigator |
筧 一彦 名古屋大学, 大学院・人間情報学研究科, 教授 (90262930)
|
Co-Investigator(Kenkyū-buntansha) |
河原 英樹 (株)ATR人間情報通信研究所, 第1研究室, 主幹研究員
赤木 正人 北陸先端大, 情報化学研究科, 助教授 (20242571)
島田 正治 長岡技科大, 工学部, 教授 (20262462)
鹿野 清宏 奈良先端大, 情報科学研究科, 教授 (00263426)
板倉 文忠 名古屋大学, 工学部, 教授 (30168299)
|
Keywords | 音場特性 / 頭外音像定位 / 残響抑圧 / 雑音抑圧 / 音源分離 / 音場再現 / 知覚的情報統合 / 音情報表現 |
Research Abstract |
頑健な人間の音知覚や音環境認知の能力を明らかにし、音声認識、雑音抑圧、音場再現などに役立つ音響信号・情報処理のモデルを実現するための基礎的研究を進め、以下の成果を得た。 音場: 実用上十分な精度での周波数軸上の音場再現逆フィルター設計法を確認した。また3次元音場にも適用可能な直交変換による音場符号化法を与えた。音場シミュレーション用の各種音場データベースを作成した。 音源定位: 零交差時間情報に基づき、高騒音下で動作可能な方向定位の工学的モデルを与えた。ヘッドホン受聴で頭外定位を実現するための逆フィルターを作成する良好なアルゴリズムを決定した。また頭部伝達関数の補間は周波数領域が有効であることを示した。複数の発話者像が視覚的に存在するとき、口の動きとマッチングする話者像の方向に音源定位がバイアスすることを発見した。音源までの距離感は仮想音源位置伝達関数のインパルス応答の短時間成分(60ms以下)に強く依存することを示した。 音源分離: J.A.Bellの相互情報量最小化に基づく音源分離法を実音場の信号に適用し、信号分離比で10dB程度の向上を確かめた。マイクロホンアレーを用いた話者方向同定によって、騒音下での音声認識率を向上させる3次元ビタービ探索法を提案し、有効性を確認した。また残響による劣下の軽減に有効な方法も提案した。2マイク、3マイクアレー設定で、それぞれ雑音と残響を抑圧する簡便で実用的な方法を提案した。また人間の知覚的特性を利用してAM調波複合音と雑音が重畳した音響信号から両者の分離抽出を可能とする方法を与えた。 音情報の表現: 時間-周波数次元上のスペクトル包絡面の新表現(STRAIGHT)と新ピッチ抽出法(TEMPO)により、高品質の音声分析合成法を得た。これは広く音情報や聴覚の研究に大きなインパクトを持つ。
|
-
[Publications] 筧一彦: "心理音声学の展望" 音聲学会報. 211. 30-39 (1996)
-
[Publications] 鵜木祐史: "雑音が付加された波形からの信号波形の一抽出" 電子情報通信学会論文誌(A). J80A・3. (1997)
-
[Publications] 滝口哲也: "雑音と残響のある環境下でのHMM合成によるハンズフリー音声認識" 電子情報通信学会論文誌D-II. J79-D-II・12. 2047-2053 (1996)
-
[Publications] 加藤和美: "母音間閉鎖子音知覚における音素特徴抽出と知覚的統合" 日本音響学会誌. 53・2. 85-94 (1997)
-
[Publications] Kazuhiko Kakehi: "Phonological Structure and Language Processing "Phoneme/syllable perception and the temporal structure of speech"" Mouton de Gruyter Eds.T.O take & A.Cutler, (125-143) (1996)