音声情報圧縮の基礎研究:言語音のスペクトル変化と発声器官の動きとの同時観測
Project/Area Number |
16J05172
|
Research Category |
Grant-in-Aid for JSPS Fellows
|
Allocation Type | Single-year Grants |
Section | 国内 |
Research Field |
Design science
|
Research Institution | Kyushu University |
Principal Investigator |
岸田 拓也 九州大学, 芸術工学府, 特別研究員(DC2)
|
Project Period (FY) |
2016-04-22 – 2018-03-31
|
Project Status |
Completed (Fiscal Year 2017)
|
Budget Amount *help |
¥1,900,000 (Direct Cost: ¥1,900,000)
Fiscal Year 2017: ¥900,000 (Direct Cost: ¥900,000)
Fiscal Year 2016: ¥1,000,000 (Direct Cost: ¥1,000,000)
|
Keywords | 音声知覚 / 音声合成 / 因子分析 / 鳴音性 / 音声強調 |
Outline of Annual Research Achievements |
平成28年度に行った9名の英語母語話者による聴取実験のデータ分析を行った。英語音声において、臨界帯域ごとのパワーの時間変動情報が圧縮されたとき、言語内容をどれだけ明瞭に知覚できるかを確かめることが目的であった。英語音声は因子分析によって数個の因子の時間変動に情報圧縮した。圧縮された情報から元のパワーの時間変動を再構成し、雑音駆動音声として再合成した。因子数が2個まででは実験参加者はほとんど言語内容を聴き取ることができなかったが、因子数が3個以上から少しずつ内容が聴きとれるようになり、8個以上用いたところで、単語正答率が80%を超えることが分かった。日本語と同様に、英語においても3因子以上から音声の内容が理解され始めるということが示された。 平成28年度までの研究で、約500~1500 Hzの周波数帯域に高い因子負荷量をもつ因子は音声知覚において特に重要であると分かった。この因子は、音韻論の分野で提唱されている音素の鳴音性と強い相関があると先行研究で示されている。鳴音性の因子が現れていない2因子からなる因子、鳴音性の因子が現れている3または4因子からなる因子のそれぞれから2因子以上を用いて雑音駆動音声を再合成し聴取実験を行った。鳴音性の因子が与える情報を持たない音声の明瞭度は低く、また因子数が2個ではどのような条件でも明瞭度は低かった。よって、雑音駆動音声の明瞭な知覚には鳴音性の情報と3つ以上の因子の情報が必要であると分かった。
|
Research Progress Status |
29年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
29年度が最終年度であるため、記入しない。
|
Report
(2 results)
Research Products
(16 results)
-
-
-
-
-
[Presentation] Intelligibility of English noise-vocoded speech resynthesized from spectral-change factors.2017
Author(s)
Kishida, T., Nakajima, Y., Ueda, K., Remijn G. B., Arndt, S., & Elliott, M. A.
Organizer
The 33rd Annual Meeting of the International Society for Psychophysics
Related Report
Int'l Joint Research
-
-
-
-
-
-
-
-
-
-
-