研究課題
騒音、他の信号、残響のある環境においても音声の内容を聴きとりやすくする音声強調の手法を開発することが本計画の目的の一つであり、これまでに開発した子音強調、帯域圧縮、帯域パワー増分強調の手法を組みあわせて、最適の条件を探るプログラムを完成させた。現在、この技術の効果を現場で実証するために、九州大学産学官連携本部等と連絡を取り、連携先を求めている。音声信号に含まれる最重要な情報を明らかにするために、毎秒3000 ビット未満の伝送率で充分明瞭な音声を伝える技術を完成させた。これは20個程度の臨界帯域に分かれるパワー変化の情報を、数個の因子の時間変化に縮約し、これに基本周波数の有無・高低の情報を付加するものである。更に一部の情報を除去して、音声の聴こえの劣化の度合いを知ることで、音声知覚の仕組みを探ることができるはずである。知覚・行動面においては、音で示された時間パターンが、どのようにカテゴリー分けして知覚されるかについて、精神物理学、脳科学の両面から検討を加えた。脳活動に関しては、音声に関係の深い喉頭領域の機能地図を作成した。一方、上記のように音声のパワー変化から導かれる因子の時間変化が、音声知覚や話者の調音運動とどのように関連付けられるかを検討した。その結果、日本語朗読文の場合、音声信号を2つの因子の時間変化に縮約したときにはほとんど言語内容が把握できないのに対して、因子数を3つにすると、日本語の拍を作る単位であるモーラで数えたとき、言語内容の約80%を聴きとることができるようになった。調音運動については、先進的な研究環境を有するトロント大学との共同研究に発展し、調音運動のデータと音声データとを同時に得たので、分析を進めている。また、スペクトログラム上でモザイク化された音声が、同様にモザイク化された、別の音声あるいは種々の雑音と分離して聴きとられうるための条件を調べている。
1: 当初の計画以上に進展している
本計画には、申請時には研究分担者に含めていなかった飛松が加わったことと、トロント大学の Willy Wong 教授、Pascal van Lieshout 教授との連携が急速に進んだことにより、当初は計画していなかった、音の時間パターンの知覚に対応する脳活動を観測することと、調音運動と音声とを同時に記録することとが可能になったので、音声コミュニケーションをより大きな枠組みの中で捉えうる可能性が高まった。また、その枠組みを支える数理科学的な手法も独自に開発し、関連分野の研究者と連絡を取りあうことができるようになった。その一方で、音声を低ビットの伝送率で伝えるという、目標が明快で挑戦性の強い技術的課題にもとり組んでおり、概ね成功している。このように、本計画は申請時に想定したものよりも大規模なものに発展している。
情報量を最小限に抑え、高齢者に対しても明瞭性を損なわない防災放送等を開発することは、社会的要請に応えるのみならず、音声知覚の仕組みを解明するうえでも重要であるので、更に進めてゆきたい。防災放送に限らず、社会においてこのような技術を必要とする領域は多いと思われ、更なる応用の道を探る。音声を20程度の臨界帯域におけるパワー変化であると捉えて因子分析を施すことをこれまでに行っており、その結果から音声を再合成することを目指して手法を改善しており、これを続ける予定である。当初の予定ではあまり重要な位置を占めていなかったが、きっちりとした数理的手法を完成させることを目標にする。また、聴きとられるべき音声信号と、それ以外の信号あるいは雑音とが、安定して聴きわけられるにはどのような条件が必要であるかについて、実験を続ける。これにはモザイク音声を用いるので、音声知覚に必要な時間精度と周波数精度とを、少なくともデモンストレーションのレベルにおいていくつかの言語に関して調べる。これまでの研究において、脳活動、調音運動の分析、およびそれに関係する数理的手法の開発が、当初予定していなかったにもかかわらず、本計画の枠組みに沿って進んでいるので、残りの研究期間においては、このような新たな研究領域をできるかぎり取りこむことに努め、音声コミュニケーションの全体を、独自の視点から総合的に捉えることを目指す。応用に関してはどうしても企業等との連携が必要になるので、提携先を見つけ、何らかの社会還元を図り、それを通じて新たな研究課題を見つけたい。
すべて 2015 2014
すべて 雑誌論文 (17件) (うち査読あり 12件、 オープンアクセス 10件、 謝辞記載あり 3件) 学会発表 (35件)
European Journal of Neuroscience
巻: 41 ページ: 232-242
10.1111/ejn.12778.
Frontiers in Psychology
巻: 5:937 ページ: 1-12
10.3389/fpsyg.2014.00937.
Frontiers in Human Neuroscience
巻: 8:281 ページ: 1-12
10.3389/fnhum.2014.00281.
Acoustics Australia
巻: 42(2) ページ: 97-101
Learner Corpus Studies in Asia and the World
巻: 2 ページ: 237-251
Clinical Neurophysiology
巻: 125 ページ: 1021-1029
10.1016/j.clinph.2013.10.005
NeuroImage
巻: 88 ページ: 162-169
10.1016/j.neuroimage.2013.11.008
巻: 125 ページ: 2404-2412
10.1016/j.clinph.2014.03.029
MS Frontier
巻: 3 ページ: 47-50
Medical Technology
巻: 42 ページ: 530-536
Clinical Neuroscience
巻: 32 ページ: 780-782
臨床神経生理学
巻: 42 ページ: 358-363
臨床神経
巻: 54 ページ: 960-962
The Journal of the Marine Acoustics Society of Japan
巻: 41(4) ページ: 169-182
Acoustical Science and Technology
巻: 35 ページ: 229-242
Neuroimage
巻: 101 ページ: 440-447
10.1016/j.neuroimage.2014.07.034
巻: 8:170 ページ: 1-11
10.3389/fnhum.2014.00170