研究課題/領域番号 |
07680388
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 北陸先端科学技術大学院大学 |
研究代表者 |
赤木 正人 北陸先端科学技術大学院大学, 情報科学研究科, 助教授 (20242571)
|
研究分担者 |
岩城 護 北陸先端科学技術大学院大学, 情報科学研究科, 助手 (20262595)
飯島 泰蔵 北陸先端科学技術大学院大学, 情報科学研究科(7年度縲怩W年度), 教授 (50016622)
|
研究期間 (年度) |
1995 – 1997
|
キーワード | 個人性 / 個人性物理関連量 / 声道 / スペクトル包絡 / 声帯 / 基本周波数 / 側音化構音 |
研究概要 |
音声における個人性は、声道情報を反映したスペクトルの包絡特性および声帯情報を反映した基本周波数特性の二つの物理量で記述されると言われている。そこで、スペクトル包絡と基本周波数の変化に含まれる個人性について調査した。また、スペクトル包絡形状と深くかかわっている音色について、構音異常音である側音化構音の音響特性とその発声機構を声道モデルを用いて調べた。得られた知見は以下の通りである。 1.スペクトル包絡について(1)個人性はスペクトル包絡全体に現れるが、高域により多く現れる。(2)話者識別にはスペクトル包絡のディップよりもピークが重要な意味を持っている。(3)個人性はスペクトル包絡の20ERBrate(1740Hz)付近のピーク以上の帯域に顕著に現れ、この帯域を利用して声質変換が可能である。(4)スペクトル包絡における個人性は基本周波数における個人性よりも話者識別に寄与する。(5)本研究により個人性を表すことが明らかになったスペクトル包絡の高域を音声合成に応用すること可能である。(6)この帯域における個人性を利用して話者正規化や話者適応を行う技術を開発することにより、不特定話者音声認識の性能向上が期待できる。 2.基本周波数について(1)基本周波数変化を数学モデルにより記述し、記述するためのパラメータの変化と知覚特性の関係を調べたところ、基本周波数の高さおよびアクセントなどのタイミングに関連するパラメータ双方が個人性に大きく関わっており、これを変化させることで個人性を変化させることができることがわかった。(2)声帯振動周期の揺れをラリンゴグラフを用いて系統的に調べたところ、話者によって比較的遅い変化(約510Hz)を持つ者、比較的速い変化(約40Hz)を持つ者、変化があまりない者の3グループに分けられることがわかった。また、聴取実験の結果、これらをお互いに知覚分離できることが明らかとなった。これより、声帯振動の揺れも個人性と関連する一つの物理量であることが言える。 3.側音化構音の音響特性(1)側音化構音のスペクトル包絡は、5kHz以上の帯域におけるパワーが少なく、3kHz付近に存在するスペクトルのピーク位置と大きさが不規則に変化していることが確認された。一方、正常音ではこのピークは見られない。(2)ピークの位置および大きさ、5kHz以上の帯域のパワーを制御して合成音を作成し、側音化構音の治療にあたっている言語臨床家に呈示したところ、側音化構音の聴覚印象が変化したことから、このピークの時間的変化および高域のパワーが側音化構音の聴覚印象を与える原因であると考えらる。(3)声道形状を模擬した声道シミュレータを作成し、側音化構音の動態と音響特性の関連を調べた。この結果、声道のせばめの位置と長さが、ピークの位置および大きさ、5kHz以上の帯域のパワーに関係していることが明らかとなった。
|