研究課題
昨年度に続き、音声知覚に必要である時間分解精度、周波数分解精度を、モザイク音声を用いて調べた。時間方向に 20 ms 程度の精度が得られ、周波数方向に適切な10帯域が得られれば、日本語のモーラ正答率にして95% 以上が達成されるが、時間分解精度、周波数分解精度のいずれが落ちても音声の明瞭度が低下する。明瞭度がゼロに近付くまでは、その傾向が続く。この枠組みを日本語以外の言語にまで広げることを目指し、英語のモザイク音声を用いた研究を始めている。音声のスペクトル変化を因子分析によって縮約して表現することを従来から試みており、今回は因子分析の結果から雑音駆動音声を再合成し、その明瞭度を求めた。この際、因子分析の方法を改良し、無音の箇所は必ず無音として再合成されるようにすることで、聴取実験の妥当性を高めた。因子の数が2から3に増加するときに明瞭度が飛躍的に増加し約 70% になることが判った。因子負荷量のパターンを、以前の分析結果と合わせて見ることにより、3-4個の因子が音声コミュニケーションの基本をなすことが結論付けられた。この因子分析法をさらに改良し、因子負荷量、因子得点のいずれも非負の値とし、因子負荷量のベクトルが直交することは崩さないようにしたところ、上記の傾向が一層はっきりと現れた。音声信号に含まれる情報のうち、上記のような因子と、時間波形の周期性とが特に重要であることに注目し、ある程度聴きとれる音声をできる限り少ない情報量で再合成することを試み、3 kb/s にまで情報量を下げることができた。この技術は、雑音下において頑強な音声を作ることにつながる。今後、コミュニケーションの品質評価に神経生理学的手法を導入するために、ささやき声や顔画像に対する脳応答の分析を行っている。さらに、ヒトの音声と他の霊長類の音声とを多変量解析の手法を用いて体系的に比較することを試みている。
1: 当初の計画以上に進展している
音声のスペクトル変化に対して因子分析を行う研究と、音声知覚に必要な時間分解精度、周波数分解精度を調べる研究とに関して、大きな進展があった。因子分析によって音声を伝える周波数帯域を4つに分割し、これを用いて雑音駆動音声を合成すれば高い明瞭度が得られることについて、国際学術誌に発表することができた。さらに、音声のスペクトル変化を多変量解析によって縮約して表現するに際して、起点移動因子分析という新しい手法により、因子得点から音声を再合成したときに、本来無音であるべき区間に定常的な雑音が出つづけるという問題を解消することができた。このことによって、再合成した音声を用いた大規模な聴取実験が可能となり、3-4個の因子が音声コミュニケーションの基本をなすことを突きとめた。この研究は国際学術誌に掲載されることが決まっている。この因子分析法をさらに改良して、因子負荷量、因子得点の双方を非負化してさらに直観的に解りやすい形で音声を再合成することにも成功し、上記の結論をより明瞭にすることができた。この成果は 2016 年7月に国際心理学会議で発表する予定である。上記の事柄に加えて、当初は想定していなかった方向に研究を進展させることができた。上記の因子分析の手法については、一般的な統計学の手法として汎用性のあることが判り、考察を進めている。また、スペクトルの時間変化に対して多変量解析を行うということは、ヒト以外の種の音声に対しても有効であるため、ヒトと他の霊長類とを音声の面から比較するという新しい研究分野が開けた。
音声のスペクトル変化を 3-4 個の因子で表現することが有効であることがはっきりしたので、今後は出発点をここに絞る。これに加えて、時間波形の周期性に関する情報が音声知覚に有効であること、時間分解精度が 40 ms であってもかなり明瞭な合成音声が得られること、が重要である。このような観点から、最適の音声強調の方法を探ってゆきたい。因子分析の方法を変形することによって、音声コミュニケーションの仕組みがより適切に捉えられることが解ってきたので、因子分析の数理的手法についても研究を進め、音声の発声と聴取とを記述するのに最適な方法を見出したい。このことによって、調音器官の動きや脳活動と音声信号との関連付けがより明確になされ、音声強調や音声信号の情報圧縮をより効率的なものにすることができると考えている。特に、因子負荷量と因子得点との両方を非負の値にする方法では、音声の再合成を、因子に相当する音源の強度を因子得点に基づいて時間的に変化させることであると考える。実際の音を同時に鳴らすという発想で捉えることができるので、直観的に解りやすい。したがって、さまざまな実験、分析の結果の関連性を探り、聴覚の仕組みや脳活動と結びつけて捉えることを可能にし、発展性の高い理論的枠組を提供しうるのではないかと考えられる。今後はこの方向での研究を進めてゆく。音声コミュニケーションについて神経生理学的な手法で研究を進めてゆく目途がついたので、上記の因子分析に関する研究を、脳活動の研究と結びつけてゆきたい。ただし、現段階では探索的なものに留まる。
すべて 2016 2015 その他
すべて 国際共同研究 (3件) 雑誌論文 (16件) (うち国際共著 2件、 査読あり 16件、 オープンアクセス 10件、 謝辞記載あり 10件) 学会発表 (29件) (うち国際学会 19件、 招待講演 5件) 図書 (4件)
NeuroImage
巻: 128 ページ: 302-315
10.1016/j.neuroimage.2015.12.057
PLOS ONE
巻: 11(3) ページ: 1-17
10.1371/journal.pone.0151374.
Autism Research
巻: 9(2) ページ: 1-11
10.1002/aur.1604.
巻: 124 ページ: 256-266
10.1016/j.neuroimage.2015.09.006.
巻: 130 ページ: 175-183
10.1016/j.neuroimage.2016.01.065.
Frontiers in Psychology
巻: 7:517 ページ: 0
10.3389/fpsyg.2016.00517.
基礎心理学研究(Japanese Journal of Psychonomic Science)
巻: 第34巻 第1号 ページ: 2-16
http://doi.org/10.14947/psychono.34.2.
Journal of the Acoustical Society of America
巻: 138 ページ: 1561-1569
http://dx.doi.org/10.1121/1.4928954.
European Journal of Neuroscience
巻: 41 ページ: 232-242
10.1111/ejn.12778.
Physiological Reports
巻: 13 ページ: 1-16
10.14814/phy2.12387.
Neuroscience Research
巻: 0 ページ: 0
10.1016/j.neures.2016.02.004.
臨床神経生理学
巻: 43 ページ: 22-62
Clinical Neuroscience
巻: 33 ページ: 543-545
日本臨床
巻: 73巻増刊号7 ページ: 167-172
Zoological Letters
巻: 1 ページ: 1-27
10.1186/s40851-015-0028-x.
JASA Express Letters
巻: 138 ページ: EL276-279
http://dx.doi.org/10.1121/1.4929734.