Project/Area Number |
22K12071
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 61010:Perceptual information processing-related
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
羽田 陽一 電気通信大学, 大学院情報理工学研究科, 教授 (80647496)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2024: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2023: ¥1,820,000 (Direct Cost: ¥1,400,000、Indirect Cost: ¥420,000)
Fiscal Year 2022: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
|
Keywords | 発話指向特性 / 球面マイクロホンアレー / 音響信号処理 / スピーカアレー / 疑似頭スピーカ / 球面スピーカアレー / 球面調和関数展開 / 臨場感 |
Outline of Research at the Start |
オンライン会議において,あたかも目の前で人が話しているかのような音の再現はリッチコミュニケーションの実現に向けて大変重要である。本研究課題では,ヒトの3次元発話放射指向特性(どの方向に対してどれくらいの大きさで声を出しているか)を詳細に再現することで,臨場感の向上を目指す。具体的には,まず発話指向特性を話者・音韻ごとに球面調和展開で分析し,再合成するための条件を明らかにする。次に,同一筐体内に複数のスピーカを持つスピーカアレーおよび発話指向特性を模擬可能なトーキングヘッドを試作し,これらを利用して,臨場感に関する主観評価実験を行う。
|
Outline of Annual Research Achievements |
オンライン会議において,あたかも目の前で人が話しているかのような音の再現はリッチコミュニケーションの実現に向けて大変重要である。本研究課題では,人の3次元発話放射指向特性(どの方向に対してどれくらいの大きさで声を出しているか)を詳細に再現することで,臨場感の向上を目指している。昨年度は,半径0.3mの頭部を囲むタイプの48ch球面マイクロホンアレーを用いて本学無響室内にて発話指向特性を測定した。さらに,球面スピーカアレーを用いて人の発話指向性再現を行い,周囲で聞いている人がどの程度識別できるかを主観評価実験により調査した。しかしながら声の音色の再現に課題が残った。そこで,本年度は。音色を保持しつつ,放射指向特性が人の発話に近づくようにするため,人の頭部を模擬した筐体に単一スピーカ素子を配置したスピーカについて,シミュレーションおよび3Dプリンタで作成した実機により検証を行った。3Dプリンタで作成した実機においては,スピーカ素子の保持に問題が生じたこともあり,正確な比較が行えなかったため,FDTD法というシミュレーション手法によって放射特性の比較を行った。頭部を剛球とみなしたスピーカ,実話者の3Dスキャンデータを用いて作成した疑似頭スピーカ,平均化された疑似頭スピーカについて実際の発話放射特性と比較を行った結果,大まかな傾向は似ているが,周波数によっては大きく異なる結果となった。このため,次年度以降では,スピーカ素子の固定方法を改善し,音色に関して逆フィルタによるイコライジングを実施し,音色を揃えた上で放射特性の比較を行う予定である。さらに,疑似頭スピーカによる放射特性および音色に関する臨場感を主観評価実験により明らかにする。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
音声発話放射特性の収録は一昨年より続けており,順調に分析が行えるようになっている。発話放射特性の模擬については,スピーカ作成の不具合を避けるため,FDTD法を用いたシミュレーション手法も検討したが,計算機の能力の関係で細かい形状の再現ができない影響もあり,概形は似ているが,周波数によっては再現精度が劣化する結果となった。一方,実際の人の頭部を3Dスキャンしたデータを用いて3Dプリンタで作成した疑似頭スピーカはスピーカ素子の固定方法や位置に依存して特性が変わるため,正確な比較が行えなかった。そのため,音色の比較自体も行うことができなかった。今後の改善の方策は得られてはいるが,これらを総合的に判断すると,進捗はやや遅れ気味であると判断している。
|
Strategy for Future Research Activity |
あたかも目の前で人が発話しているように感じられる疑似頭スピーカを3Dプリンタで作成し,指向特性の再現と周波数特性(音色)について最終年度では明らかにしていく。このためには,発話指向特性が低次の球面調和領域で一致しているかなど,概形を重視した分析を進める。一方で,音色については生声に近い性能が出せるように逆フィルタをベースとしたディジタルイコライザを導入して調整を行う。これらの結果に基づいて,3Dプリンタを用いて,いくつかの形状について疑似頭スピーカを作成し,主観評価実験を実施することで,放射特性および音色に関する臨場感を明らかにする。
|