2013 Fiscal Year Annual Research Report
公共空間における音響放送の改善:知覚的相互作用を考慮した音デザイン
Project/Area Number |
25242002
|
Research Category |
Grant-in-Aid for Scientific Research (A)
|
Research Institution | Kyushu University |
Principal Investigator |
中島 祥好 九州大学, 芸術工学研究科(研究院), 教授 (90127267)
|
Co-Investigator(Kenkyū-buntansha) |
松尾 行雄 東北学院大学, 教養学部, 准教授 (40323117)
REMIJN Gerard B. 九州大学, 学内共同利用施設等, 准教授 (40467098)
上田 和夫 九州大学, 芸術工学研究科(研究院), 准教授 (80254316)
飛松 省三 九州大学, 医学(系)研究科(研究院), 教授 (40164008)
|
Project Period (FY) |
2013-04-01 – 2018-03-31
|
Keywords | 音声強調 / 音声情報圧縮 / モザイク音声 / 時間分解能 / 多変量解析 / 音韻論 / 脳波 / 脳磁図 |
Research Abstract |
騒音、残響、他の音声信号との混合に対して、音声信号を知覚のうえで頑強にする技術を開発した(所属大学に発明届を提出、特許出願準備中)。この技術を利用して、音声信号を1秒あたり数キロビット以下の情報量に圧縮しても、充分な明瞭度を得ることが可能になった。このような、情報圧縮の基礎研究として、音声知覚に必要な時間分解能、周波数分解能を測定するために、時間、周波数の座標上でパワーをモザイク化した音声を作成し、時間分解能を中心に日本語文音声の聴取実験を行った。その結果、日本語音声を聴きとるために必要な時間分解能は 0.04~0.08 秒程度であることが判った。すなわち、映画の一コマごとのタイミングでスペクトルを変化させてゆけば、ある程度音声の内容が伝わる。音声信号のスペクトル変化の様子を多変量解析によって捉える研究を、従来行っていたものからさらに進展させた。すなわち、ケプストラム分析によるスペクトルの平滑化、因子分析を音響パワーがゼロになる(空白の)状態を基点として行うこと、などの改良を加え、常に安定した4因子が得られるようになった。このことにより、分析結果を音韻論の立場から解釈することが容易になった。たとえば、子音の有声性が知覚されるためのスペクトル変化の条件を特定することができた。さらに、ささやき声と通常発声による音声との定量的な比較ができるようになった。加えて、因子分析によって得られた因子得点から、音声を合成することが可能になった。音声コミュニケーションに関わる脳活動(脳波、脳磁図)の計測を行い、吃音症患者において、左右の聴覚野の機能連関が健常者に比べて強いことなどを示した。また、自閉症児における音声に対する脳反応の特徴について調べた。このように、音声コミュニケーションにとって重要なリズム知覚に関しても、知覚心理学、脳科学の立場から考察を進めている。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
音声強調、音声情報圧縮に関して、思いのほか早く新しい技術を開発することができた。これは、音声情報を音源情報とフィルター情報とに分ける古典的な考えかたを、徹底して単純化したことで可能となったもので、現在特許出願を準備している。また、モザイク音声の知覚に関する実験は順調に進み、日本語音声を聴取するために必要な時間分解能が意外に粗く、20分の1秒程度であることを明瞭に結論付けることができた。この成果については、雑誌論文をまもなく投稿することができる。
|
Strategy for Future Research Activity |
雑音、残響、歪みなどによって音声がどのように劣化するかを、定量的に推測する方法について考察する。また、複数の聴覚信号の聴き分けがなされる仕組みについて、モザイク音声ないし類似の音刺激を用いて解明することを試みる。このような基礎のうえに立って、独自の音声処理技術を応用することのできる具体的な場面を想定し、最適の方法を見出す。特に、複数の音声信号を、知覚上の干渉を最小限にして伝える方法を考える。
|
-
-
-
-
[Journal Article] Atypical brain lateralisation in the auditory cortex and language performance in 3- to 7-year-old children with high-functioning autism spectrum disorder: a child-customised magnetoencephalography (MEG) study.2013
Author(s)
Yoshimura, Y., Kikuchi, M., Shitamichi, K., Ueno, S., Munesue, T., Ono, Y., Tsubokawa, T., Haruta, Y., Oi, M., Niida, Y., Remijn, G.B., Takahashi, T., Suzuki, M., Higashida, H., Minabe, Y.
-
Journal Title
Molecular Autism
Volume: 4
Pages: 38
DOI
Peer Reviewed
-
[Journal Article] The brain’s response to the human voice depends on the incidence of autistic traits in the general population.2013
Author(s)
Yoshimura, Y., Kikuchi, M., Ueno, S., Okumura, E., Hiraishi, H., Hasegawa, C., Remijn, G.B., Shitamichi, K., Munesue, T., Tsubokawa, T., Higashida, H., Minabe, Y.
-
Journal Title
PloSONE
Volume: 8
Pages: e80126
DOI
Peer Reviewed
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
[Presentation] Sonority in British English2013
Author(s)
Yoshitaka Nakajima, Kazuo Ueda, Shota Fujimaru, Yuki Ohsaka
Organizer
21st International Congress on Acoustics, 165th Meeting of the Acoustical Society of America, 52nd Meeting of the Canadian Acoustical Association
Place of Presentation
Montreal, Canada
Year and Date
20130602-20130607
-
-
[Presentation] Cortical hemodynamic response patterns to normal and whispered speech.2013
Author(s)
Remijn, G.B., Kikuchi, M., Yoshimura, Y., Ueno, S., Minabe, Y.
Organizer
21st International Congress on Acoustics, 165th Meeting of the Acoustical Society of America, 52nd Meeting of the Canadian Acoustical Association
Place of Presentation
Montreal, Canada
Year and Date
20130602-20130607
-
-
-