研究課題/領域番号 |
22K12071
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 電気通信大学 |
研究代表者 |
羽田 陽一 電気通信大学, 大学院情報理工学研究科, 教授 (80647496)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2024年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2023年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | 発話指向特性 / 球面マイクロホンアレー / 音響信号処理 / スピーカアレー / 球面スピーカアレー / 球面調和関数展開 / 臨場感 |
研究開始時の研究の概要 |
オンライン会議において,あたかも目の前で人が話しているかのような音の再現はリッチコミュニケーションの実現に向けて大変重要である。本研究課題では,ヒトの3次元発話放射指向特性(どの方向に対してどれくらいの大きさで声を出しているか)を詳細に再現することで,臨場感の向上を目指す。具体的には,まず発話指向特性を話者・音韻ごとに球面調和展開で分析し,再合成するための条件を明らかにする。次に,同一筐体内に複数のスピーカを持つスピーカアレーおよび発話指向特性を模擬可能なトーキングヘッドを試作し,これらを利用して,臨場感に関する主観評価実験を行う。
|
研究実績の概要 |
オンライン会議において,あたかも目の前で人が話しているかのような音の再現はリッチコミュニケーションの実現に向けて大変重要である。本研究課題では,人の3次元発話放射指向特性(どの方向に対してどれくらいの大きさで声を出しているか)を詳細に再現することで,臨場感の向上を目指している。本年度は,まず半径0.3mの頭部を囲むタイプの48ch球面マイクロホンアレーを用いて本学無響室内にて4名の発話指向特性を測定し,母音と子音による特性の差異について評価を行った。その結果,鼻母音においては他の子音よりも上向き方向に強く音が放射されるなど音韻によって指向特性が異なることが分かった。一方で,個人性も確認されたが,他人の指向性と入れ替えた実験を行った結果,特に差異が感じられなかったため,個人性はさほど大きくないと判断できた。また,分析方法として子音は継続発話が難しいため,区切りながらの発話を切り出し,平均することで分析を行う方法を考案するなど工夫を行った。 さらに,スピーカ再生を用いて発話者が回転している様子を受聴者が知覚できるかを検証するため,球面スピーカアレーを用いた発話指向性再現を行い,周囲で聞いている人がどの程度識別できるかを主観評価実験により調査した。その結果,スピーカアレーの補正方法によって指向性再現と音色の再現にトレードオフの関係があることが分かった。このため,次年度以降の発話指向性再現においてはこの課題についても取り組むこととする。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
音声発話放射特性の分析についてはコロナ禍の影響もあり,母音や子音の発話を同一話者で詳細に調べることが難しく,データを思うように収集できなかった。この点については進捗としてはやや遅れていると判断しており,次年度以降も引き続きデータ収集に努める。一方で発話指向特性の再現が臨場感に寄与するかを確かめるため,先行して球面スピーカアレーを用いた主観評価実験を行った。この際,周波数特性自体を生の発話に近づけることが想定より難しく,評価値の低さが目立ったが,課題を事前に明確にすることができたと考えている。これらを総合的に判断し進捗は順調であると判断している。
|
今後の研究の推進方策 |
あたかも目の前で人が発話しているように感じられるスピーカを構築するために必要な指向特性の再現精度と周波数特性(音色)について次年度では明らかにしていく。このためには,指向特性を球面調和関数展開した次数を削減することで指向性を緩める一方,音色については生声に近い性能が出せるように逆フィルタをベースとしたディジタルイコライザーを導入して調整を行う予定である。
|