研究課題/領域番号 |
07308026
|
研究種目 |
基盤研究(A)
|
配分区分 | 補助金 |
応募区分 | 総合 |
研究分野 |
知能情報学
|
研究機関 | 名古屋大学 |
研究代表者 |
筧 一彦 名古屋大学, 大学院・人間情報学研究科, 教授 (90262930)
|
研究分担者 |
河原 英紀 (株)ATR, 人間情報通信研究所・第1研究室, 主幹研究員
赤木 正人 北陸先端大, 情報科学研究科, 助教授 (20242571)
島田 正治 長岡技科大, 工学部, 教授 (20262462)
鹿野 清宏 奈良先端大, 情報科学研究科, 教授 (00263426)
板倉 文忠 名古屋大学, 工学部, 教授 (30168299)
河原 英樹 (株)ATR人間情報通信研究所, 第1研究室, 主幹研究員
|
研究期間 (年度) |
1995 – 1996
|
研究課題ステータス |
完了 (1996年度)
|
配分額 *注記 |
10,600千円 (直接経費: 10,600千円)
1996年度: 3,900千円 (直接経費: 3,900千円)
1995年度: 6,700千円 (直接経費: 6,700千円)
|
キーワード | 音場特性 / 頭外音像定位 / 残響抑圧 / 雑音抑圧 / 音源分離 / 音場再現 / 知覚的情報統合 / 音情報表現 / フォーカシング / 音声生成・知覚相互作用 |
研究概要 |
頑健な人間の音知覚や音環境認知の能力を明らかにし、音声認識、雑音抑圧、音場再現などに役立つ音響信号・情報処理のモデルを実現するための基盤的研究を進めた。音源方向同定と残響抑圧に関する新しい方法を示し、これらを単に従来のように音声認識の前処理として使用するのではなく、認識アルゴリズムと一体化する方法を示した。本研究で明らかにされた人間の音知覚における情報の知覚的統合能力にはまだ及ばないものの音環境情報の統合を軸とした今後の音声認識の研究方向を打ち出し得た意義は大きい。個々の具体的成果を以下に示す。 音場: 実用上十分な精度での周波数軸上の音場再現逆フィルター設計法を確認した。また3次元音場にも適用可能な直交変換による音場符号化法を与えた。音場シミュレーション用の各種音場データベースを作成した。 音源定位: 零交差時間情報に基づく、騒音に頑健な方向定位の工学的モデルを与えた。ヘッドホン受聴頭外定位の逆フィルターを求める良好なアルゴリズムを決定した。また頭部伝達関数の補間は周波数領域が有効であることを示した。複数の発話者像が視覚的に存在するときの、音源定位バイアスを発見した。音源までの距離感は仮想音源位置伝達関数のインパルス応答の短時間成分 (60ms以下) に強く依存することを示した。 音源分離: 相互情報量最小化に基づく音源分離法を実音場の信号に適用し、効果を確認した。2マイク、3マイクアレー設定で、それぞれ雑音と残響を抑圧する簡便で実用的な方法を提案した。また人間の知覚的特性を利用してAM調波複合音と雑音が重畳した音響信号から両者の分離抽出を可能とする方法を与えた。 音情報の表現: 時間一周波数次元上のスペクトル包絡面の新表現 (STRAIGHT) と新ピッチ抽出法 (TEMPO) により、高品質の音声分析合成法を得た。これは広く音情報や聴覚の研究に大きなインパクトを持つ。
|