2005 Fiscal Year Annual Research Report
音声の個人性の類似性知覚を決定づける物理量に関する研究
Project/Area Number |
16700199
|
Research Institution | Advanced Telecommunications Research Institute International |
Principal Investigator |
北村 達也 株式会社国際電気通信基礎技術研究所, 人間情報科学研究所, 主任研究員 (60293594)
|
Keywords | 音声の個人性 / 個人性知覚 / 類似性 / 声質 |
Research Abstract |
従来,音声の個人性知覚に関して様々な物理量の寄与が指摘されているが,個人性を表わすために必要十分な物理量のリストは解明されていない.本研究では個人間の差異ではなく類似性に着目することによって,この問題を解決する.つまり,個人性が似ている2人の音声を分析し,2人の間で値が近い物理量を抽出すれば,個人性知覚に本質的な物理量が特定できる.逆に,この2人の間で値が大きく異なる物理量は個人性知覚にとって本質的ではないといえる.この考えにもとづいて個人性の類似度知覚の要因となる物理量を特定する検討を進めている. 第2年度である本年度は音声中の静的な特徴量に着目した.声質が似ているとされる2名を含む成人男性8人が発声した持続母音および文章音声を収録し分析および聴取実験を行った.この2名は電話を通した会話や壁越しの会話で間違われることが多いため,低周波数成分が声質の類似性に対する寄与が高いと予想し,周波数帯域と声質の類似性評価との関係を調べる聴取実験を行った.2kHz,3kHz,4kHz,8kHzのカットオフのローパスフィルタ(LPF)をかけた音声刺激を用意し,被験者に上記の話者8名の中で似ているペアを判断させた.その結果,予想に反してカットオフ8kHzのLPFを施した刺激音において最も類似性が高いと判断されることが示された.実験後のインタビューの結果,音声中の時間変化パターンよりむしろ高周波数領域に特徴のある母音の音色がこの2名の類似性に寄与しているという一致した内観が得られた.この内観報告にもとづいて音声スペクトルを分析したところ,文章音声中の一部の母音で約2kHz以上の高周波数領域のスペクトル構造が酷似しており,これが類似性に寄与する可能性が示唆された.
|