研究課題
基盤研究(A)
騒音、残響、他の音声信号との混合に対して、音声信号を知覚のうえで頑強にする技術を開発した(所属大学に発明届を提出、特許出願準備中)。この技術を利用して、音声信号を1秒あたり数キロビット以下の情報量に圧縮しても、充分な明瞭度を得ることが可能になった。このような、情報圧縮の基礎研究として、音声知覚に必要な時間分解能、周波数分解能を測定するために、時間、周波数の座標上でパワーをモザイク化した音声を作成し、時間分解能を中心に日本語文音声の聴取実験を行った。その結果、日本語音声を聴きとるために必要な時間分解能は 0.04~0.08 秒程度であることが判った。すなわち、映画の一コマごとのタイミングでスペクトルを変化させてゆけば、ある程度音声の内容が伝わる。音声信号のスペクトル変化の様子を多変量解析によって捉える研究を、従来行っていたものからさらに進展させた。すなわち、ケプストラム分析によるスペクトルの平滑化、因子分析を音響パワーがゼロになる(空白の)状態を基点として行うこと、などの改良を加え、常に安定した4因子が得られるようになった。このことにより、分析結果を音韻論の立場から解釈することが容易になった。たとえば、子音の有声性が知覚されるためのスペクトル変化の条件を特定することができた。さらに、ささやき声と通常発声による音声との定量的な比較ができるようになった。加えて、因子分析によって得られた因子得点から、音声を合成することが可能になった。音声コミュニケーションに関わる脳活動(脳波、脳磁図)の計測を行い、吃音症患者において、左右の聴覚野の機能連関が健常者に比べて強いことなどを示した。また、自閉症児における音声に対する脳反応の特徴について調べた。このように、音声コミュニケーションにとって重要なリズム知覚に関しても、知覚心理学、脳科学の立場から考察を進めている。
1: 当初の計画以上に進展している
音声強調、音声情報圧縮に関して、思いのほか早く新しい技術を開発することができた。これは、音声情報を音源情報とフィルター情報とに分ける古典的な考えかたを、徹底して単純化したことで可能となったもので、現在特許出願を準備している。また、モザイク音声の知覚に関する実験は順調に進み、日本語音声を聴取するために必要な時間分解能が意外に粗く、20分の1秒程度であることを明瞭に結論付けることができた。この成果については、雑誌論文をまもなく投稿することができる。
雑音、残響、歪みなどによって音声がどのように劣化するかを、定量的に推測する方法について考察する。また、複数の聴覚信号の聴き分けがなされる仕組みについて、モザイク音声ないし類似の音刺激を用いて解明することを試みる。このような基礎のうえに立って、独自の音声処理技術を応用することのできる具体的な場面を想定し、最適の方法を見出す。特に、複数の音声信号を、知覚上の干渉を最小限にして伝える方法を考える。
すべて 2014 2013
すべて 雑誌論文 (7件) (うち査読あり 6件) 学会発表 (27件) 図書 (2件)
Acta Psychologica
巻: 147 ページ: 111-121
10.1016/j.actpsy.2013.10.003. Epub 2013 Nov 5.
NeuroImage
巻: 88 ページ: 162-169
10.1016/j.neuroimage.2013.11.008.
Exp Neurol
巻: 250 ページ: 313-320
10.1016/j.expneurol.2013.10.005
Molecular Autism
巻: 4 ページ: 38
10.1186/2040-2392-4-38
PloSONE
巻: 8 ページ: e80126
10.1371/journal.pone.0080126
Frontiers in Psychology
巻: 4:57 ページ: 1-10
10.3389/fpsyg.2013.00057
基礎心
巻: 32 ページ: 88-93