2015 Fiscal Year Annual Research Report
公共空間における音響放送の改善:知覚的相互作用を考慮した音デザイン
Project/Area Number |
25242002
|
Research Institution | Kyushu University |
Principal Investigator |
中島 祥好 九州大学, 芸術工学研究科(研究院), 教授 (90127267)
|
Co-Investigator(Kenkyū-buntansha) |
飛松 省三 九州大学, 医学(系)研究科(研究院), 教授 (40164008)
松尾 行雄 東北学院大学, 教養学部, 教授 (40323117)
Remijn GerardB. 九州大学, 芸術工学研究科(研究院), 准教授 (40467098)
上田 和夫 九州大学, 芸術工学研究科(研究院), 准教授 (80254316)
|
Project Period (FY) |
2013-04-01 – 2018-03-31
|
Keywords | 音声 / 時間分解精度 / 周波数分解精度 / モザイク音声 / 因子分析 / 情報圧縮 |
Outline of Annual Research Achievements |
昨年度に続き、音声知覚に必要である時間分解精度、周波数分解精度を、モザイク音声を用いて調べた。時間方向に 20 ms 程度の精度が得られ、周波数方向に適切な10帯域が得られれば、日本語のモーラ正答率にして95% 以上が達成されるが、時間分解精度、周波数分解精度のいずれが落ちても音声の明瞭度が低下する。明瞭度がゼロに近付くまでは、その傾向が続く。この枠組みを日本語以外の言語にまで広げることを目指し、英語のモザイク音声を用いた研究を始めている。 音声のスペクトル変化を因子分析によって縮約して表現することを従来から試みており、今回は因子分析の結果から雑音駆動音声を再合成し、その明瞭度を求めた。この際、因子分析の方法を改良し、無音の箇所は必ず無音として再合成されるようにすることで、聴取実験の妥当性を高めた。因子の数が2から3に増加するときに明瞭度が飛躍的に増加し約 70% になることが判った。因子負荷量のパターンを、以前の分析結果と合わせて見ることにより、3-4個の因子が音声コミュニケーションの基本をなすことが結論付けられた。この因子分析法をさらに改良し、因子負荷量、因子得点のいずれも非負の値とし、因子負荷量のベクトルが直交することは崩さないようにしたところ、上記の傾向が一層はっきりと現れた。 音声信号に含まれる情報のうち、上記のような因子と、時間波形の周期性とが特に重要であることに注目し、ある程度聴きとれる音声をできる限り少ない情報量で再合成することを試み、3 kb/s にまで情報量を下げることができた。この技術は、雑音下において頑強な音声を作ることにつながる。 今後、コミュニケーションの品質評価に神経生理学的手法を導入するために、ささやき声や顔画像に対する脳応答の分析を行っている。さらに、ヒトの音声と他の霊長類の音声とを多変量解析の手法を用いて体系的に比較することを試みている。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
音声のスペクトル変化に対して因子分析を行う研究と、音声知覚に必要な時間分解精度、周波数分解精度を調べる研究とに関して、大きな進展があった。因子分析によって音声を伝える周波数帯域を4つに分割し、これを用いて雑音駆動音声を合成すれば高い明瞭度が得られることについて、国際学術誌に発表することができた。さらに、音声のスペクトル変化を多変量解析によって縮約して表現するに際して、起点移動因子分析という新しい手法により、因子得点から音声を再合成したときに、本来無音であるべき区間に定常的な雑音が出つづけるという問題を解消することができた。このことによって、再合成した音声を用いた大規模な聴取実験が可能となり、3-4個の因子が音声コミュニケーションの基本をなすことを突きとめた。この研究は国際学術誌に掲載されることが決まっている。この因子分析法をさらに改良して、因子負荷量、因子得点の双方を非負化してさらに直観的に解りやすい形で音声を再合成することにも成功し、上記の結論をより明瞭にすることができた。この成果は 2016 年7月に国際心理学会議で発表する予定である。 上記の事柄に加えて、当初は想定していなかった方向に研究を進展させることができた。上記の因子分析の手法については、一般的な統計学の手法として汎用性のあることが判り、考察を進めている。また、スペクトルの時間変化に対して多変量解析を行うということは、ヒト以外の種の音声に対しても有効であるため、ヒトと他の霊長類とを音声の面から比較するという新しい研究分野が開けた。
|
Strategy for Future Research Activity |
音声のスペクトル変化を 3-4 個の因子で表現することが有効であることがはっきりしたので、今後は出発点をここに絞る。これに加えて、時間波形の周期性に関する情報が音声知覚に有効であること、時間分解精度が 40 ms であってもかなり明瞭な合成音声が得られること、が重要である。このような観点から、最適の音声強調の方法を探ってゆきたい。 因子分析の方法を変形することによって、音声コミュニケーションの仕組みがより適切に捉えられることが解ってきたので、因子分析の数理的手法についても研究を進め、音声の発声と聴取とを記述するのに最適な方法を見出したい。このことによって、調音器官の動きや脳活動と音声信号との関連付けがより明確になされ、音声強調や音声信号の情報圧縮をより効率的なものにすることができると考えている。特に、因子負荷量と因子得点との両方を非負の値にする方法では、音声の再合成を、因子に相当する音源の強度を因子得点に基づいて時間的に変化させることであると考える。実際の音を同時に鳴らすという発想で捉えることができるので、直観的に解りやすい。したがって、さまざまな実験、分析の結果の関連性を探り、聴覚の仕組みや脳活動と結びつけて捉えることを可能にし、発展性の高い理論的枠組を提供しうるのではないかと考えられる。今後はこの方向での研究を進めてゆく。 音声コミュニケーションについて神経生理学的な手法で研究を進めてゆく目途がついたので、上記の因子分析に関する研究を、脳活動の研究と結びつけてゆきたい。ただし、現段階では探索的なものに留まる。
|
-
-
-
-
[Journal Article] The inhibition/excitation ratio related to task-induced oscillatory modulations during a working memory task: A multimodal-imaging study using MEG and MRS.2016
Author(s)
Fujihara, K., Tagawa, M., Hironaga, N., Near, J., Kasagi, M., Takahashi, Y., Motegi, T., Suzuki, Y., Aoyama, Y., Sakurai, N., Yamaguchi, M., Tobimatsu, S., Ujita, K., Tsushima, Y., Narita, K., & Fukuda, M.
-
Journal Title
NeuroImage
Volume: 128
Pages: 302-315
DOI
Peer Reviewed / Open Access / Int'l Joint Research
-
-
[Journal Article] Atypical development of the central auditory system in young children with Autism spectrum disorder.2016
Author(s)
Yoshimura, Y., Kikuchi, M., Hiraishi, H., Hasegawa, C., Takahashi, T., Remijn, G. B., Oi, M., Munesue, T., Higashida, H., Minabe, Y., Kojima, H.
-
Journal Title
Autism Research
Volume: 9(2)
Pages: 1-11
DOI
Peer Reviewed / Open Access
-
[Journal Article] Neuromagnetic evidence for hippocampal modulation of auditory processing.2016
Author(s)
Chatani, H., Hagiwara, K., Hironaga, N., Ogata, K., Shigeto, H., Morioka, T., Sakata, A., Hashiguchi, K., Murakami, N., Uehara, T., Kira, J., Tobimatsu, S.
-
Journal Title
NeuroImage
Volume: 124
Pages: 256-266
DOI
Peer Reviewed / Open Access / Acknowledgement Compliant
-
[Journal Article] spatiotemporal signature of cortical pain relief by tactile stimulation: An MEG study.2016
Author(s)
Hayamizu, M., Hagiwara, K., Hironaga, N., Ogata, K., Hoka, S., Tobimatsu, S.
-
Journal Title
NeuroImage
Volume: 130
Pages: 175-183
DOI
Peer Reviewed / Acknowledgement Compliant
-
-
-
-
-
[Journal Article] Neural substrates of species-dependent visual processing of faces: Use of morphed faces.2015
Author(s)
Yamada E., Ogata, K., Kishimoto, J., Tanaka, M., Urakawa, T., Yamasaki, T., Tobimatsu, S.
-
Journal Title
Physiological Reports
Volume: 13
Pages: 1-16
DOI
Peer Reviewed / Open Access
-
[Journal Article] Neuromagnetic evidence that the right fusiform face area is essential for human face awareness: An intermittent binocular rivalry study.2015
Author(s)
Kume, Y., Maekawa, T., Urakawa, T., Hironaga, N., Ogata, K., Shigyo, M., Tobimatsu, S.
-
Journal Title
Neuroscience Research
Volume: 0
Pages: 0
DOI
Peer Reviewed / Acknowledgement Compliant
-
-
-
-
[Journal Article] Individuality embedded in the isolation calls of captive beluga whales (Delphinapterus leucas).2015
Author(s)
Mishima, Y., Morisaka, T., Itoh, M., Matsuo, I., Sakaguchi, A., Miyamoto, Y.
-
Journal Title
Zoological Letters
Volume: 1
Pages: 1-27
DOI
Peer Reviewed / Open Access / Acknowledgement Compliant
-
-
-
-
-
-
-
-
[Presentation] Intelligibility of locally time-reversed speech in four languages: Comparison among Chinese, English, German, and Japanese.2016
Author(s)
Ueda, K., Nakajima, Y., Tamura, S., Shichida, A., Ellermeier, W., Kattner, F., Daebler, S., Neo, N. N.
Organizer
第 49 回知覚コロキウム
Place of Presentation
仙台
Year and Date
2016-03-16 – 2016-03-16
-
-
-
-
[Presentation] Intelligibility of locally time-reversed speech in four different languages.2015
Author(s)
Ueda, K., Nakajima, Y., Tamura, S., Ellermeier, W., Kattner, F., Daebler, S., Neo, N. N.
Organizer
Proceedings of the 2nd Annual Meeting of the Society for Bioacoustics
Place of Presentation
Fukuoka, Japan
Year and Date
2015-12-12 – 2015-12-12
Int'l Joint Research
-
-
-
-
-
[Presentation] Intelligibility of locally time-reversed speech in four different languages: A fairly constant effect of segment duration.2015
Author(s)
Ueda, K., Nakajima, Y., Tamura, S., Shichida, A., Ellermeier, W., Kattner, F., Daebler, S., Neo, N. N.
Organizer
Lunch Hour Colloquium, UBC
Place of Presentation
Vancouver, Canada
Year and Date
2015-10-14 – 2015-10-14
Int'l Joint Research
-
-
-
[Presentation] Perceived durations of filled and empty intervals2015
Author(s)
Hasuo, E., Nakajima, Y., Kishida, T., Remijn, G. B., Ueda, K.
Organizer
Fechner Day 2015, Proceedings of the 31st Annual Meeting of the International Society for Psychophysics.
Place of Presentation
Quebec, Canada
Year and Date
2015-08-19 – 2015-08-19
Int'l Joint Research
-
[Presentation] The effect of segment duration on the intelligibility of locally time-reversed speech: A multilingual comparison.2015
Author(s)
Ueda, K., Nakajima, Y., Tamura, S., Shichida, A., Ellermeier, W., Kattner, F., Daebler, S.
Organizer
Fechner Day 2015, Proceedings of the 31st Annual Meeting of the International Society for Psychophysics
Place of Presentation
Quebec, Canada
Year and Date
2015-08-18 – 2015-08-18
Int'l Joint Research
-
-
-
-
-
-
-
[Presentation] A high-density ERP study on right hemispheric superiority in face recognition.2015
Author(s)
Takamiya, N., Maekawa, T., Yamasaki, T., Ogata, K., Yamada, E., Tanaka, M., Tobimatsu, S.
Organizer
2015 International Conference on Complex Medical Engineering
Place of Presentation
Okayama, Japan
Year and Date
2015-06-18 – 2015-06-18
Int'l Joint Research
-
-
-
-
-
-