2012 Fiscal Year Research-status Report
高齢者音声を明瞭化する音声処理インタフェースに関する研究
Project/Area Number |
23560459
|
Research Institution | Kyushu Institute of Technology |
Principal Investigator |
中藤 良久 九州工業大学, 工学(系)研究科(研究院), 教授 (10599955)
|
Co-Investigator(Kenkyū-buntansha) |
水町 光徳 九州工業大学, 工学(系)研究科(研究院), 准教授 (90380740)
|
Keywords | 高齢者音声 / 明瞭化 / データベース / 音声処理 / インタフェース |
Research Abstract |
(実績1)平成23年度は、高齢者音声の「語頭」での特徴解析を行い、スペクトルの変化の大きさを表す「遷移量」が高齢化に伴い低下することが分かった。そこで、平成24年度は、成人音声の遷移量を基準とし、高齢者の遷移量から成人の遷移量を引いた差「遷移量差」を求めた。その結果、/p/、/t/、/b/、/d/のように調音位置が前方に位置し、さらに舌や唇の動きを伴う子音では遷移量差の絶対値が大きく、一方、/c/、/k/、/g/といった調音位置が後方に位置する音素では、遷移量差の絶対値が小さいことがわかった。また、母音においては、口腔の体積が大きい/a/、/e/では、遷移量差の絶対値が大きく、一方、口腔の体積が小さい/i/、/u/では遷移量差の絶対値が小さくなった。これまで、高齢者音声における音響的特徴と舌や唇の動きなどの調音位置との関係は明らかになっておらず、今回始めて明確になった成果である。以上より、「遷移量」が大きくなるようにスペクトルを変化させる、あるいは「遷移量差」が小さくなるようにスペクトルを変化させることで、高齢者から成人への音声の変換が可能になり、明瞭性を改善できる可能性があることが分かった。 (実績2)高齢者音声の特徴である「しゃがれ」について調査を行った結果、母音や有声音のバズ部のような声帯振動を伴う音素で起こり、パワースペクトルの高域成分でのパワーが増大することが分かった。また、しゃがれ声は語頭で顕著に表れることが分かった。これは高齢者は比較的語頭において力んで発声することが多いことから生じると考えられる。以上より、語頭における有声音のパワースペクトルの高域成分を抑制することで「しゃがれ」感を低減でき、明瞭性を改善できる可能性があることが分かった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究の目的は、世界的に益々増加する高齢者への支援を目的に、実環境において高齢者音声を明瞭化する音声処理インタフェースの構築を目指すことである。そのため平成24年度の計画は、(a)平成23年度に行った高齢者の音響的特徴の検討結果と変換パラメータの予備検討を踏まえて、高齢者音声を明瞭化するための変換パラメータに関する研究を継続する、(b)変換パラメータを用いて高齢者音声の特徴を一般成人の特徴へと変換する方法についての研究を実施する、ことであった。この計画に対し、平成24年度は以下の2点の成果が得られたことにより、高齢者音声から成人音声へと変換する方法の検討がおおむね順調に進んでいると判断している。 (1)「遷移量差」よる高齢者音声から成人音声への変換方法 高齢者の遷移量から成人の遷移量を引いた差「遷移量差」おいて、特定の音素(破裂音/p/、/t/、/b/、/d/、母音/a/、/e/)では「遷移量差」の絶対値が大きいことから、高齢者から成人への音声の特徴を変換するパラメータとして有望であることが明らかになった。 (2)高齢者音声の特徴である「しゃがれ」の音響的特徴の解明 高齢者音声の特徴である「しゃがれ」は、しゃがれ声は語頭で顕著に表れ、また母音や有声音のバズ部において、パワースペクトルの高域成分のパワー増大として表出することが分かった。その結果、語頭における有声音のパワースペクトルの高域成分を抑制することで、高齢者から成人への音声の変換が可能であることが分かった。
|
Strategy for Future Research Activity |
平成25年度は、平成24年度の結果を踏まえて、(1)高齢者音声の特徴を一般成人の特徴へと変換する方法の改良を行い、さらに(2)実際に動作するプロトタイプシステムの構築、および評価を行う予定である。まず(1)については、高齢者音声の「遷移量」が大きくなるようにスペクトルを変化させる、あるいは「遷移量差」が小さくなるようにスペクトルを変化させる方法により、高齢者から成人への音声の変換が可能かどうか検討する。また、変換すべき音韻、すなわち破裂音では/p/、/t/、/b/、/d/、母音では/a/、/e/かどうかを音韻識別技術を用いて判定し、該当音韻に対してスペクトル変化の制御を行うことで変換を行う。一方(2)としては、高齢者音声の特徴を一般成人へと変換する方式の実装を行い、高齢者音声処理インタフェースのプロトタイプを完成させる。高齢者音声が成人音声にどの程度近づいたかを評価する際には、PC上のオフラインでのシミュレーションだけでなく、実際に動作するプロトタイプシステムでの評価を行うことが必要である。ところで、変換精度の評価には歪みなどの物理的尺度だけでなく、聴取実験等による主観評価を合わせて行う予定である。なお、平成25年度は、高齢者音声を明瞭化する音声処理インタフェースのプロトタイプを構築するための評価用PCを導入する予定である。また、高齢者の音響的特徴と方式検討とは密接に関連しているため、平成25年度も必要に応じて音声データベースの拡充を行う。特に実際に動作するプロトタイプシステムでの評価を行う際には、できるだけ自然な発声である連続音声を収録しデータベースとして評価に用いる予定である。
|
Expenditure Plans for the Next FY Research Funding |
平成23年度に予定していたマイクなどの収音装置の購入費用や連続音声データベースの構築費用は、平成25年度に実施する予定である。これは、高齢者の音響的特徴の検討と変換パラメータの検討を優先したためである。また実際に動作するプロトタイプシステムでの評価を行う際には、プロトタイプを用いてデータの収録を行った方が課題の抽出に有利であると判断したことも理由である。そこで平成25年度は、収録機器(マイク、アンプ、など)を購入し、高齢者の連続音声データベースの構築を行う予定である。さらに、音声変換方式の検討・評価実験やプロトタイプを構築するための高性能PCを導入する予定である。ところで、高齢者の音響的特徴と方式検討とは密接に関連しているため、それらを相補的に発展させることを計画している。そのため、平成25年度も必要に応じて高齢者音声の特徴分析を継続する。
|