Budget Amount *help |
¥2,990,000 (Direct Cost: ¥2,300,000、Indirect Cost: ¥690,000)
Fiscal Year 2016: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2015: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2014: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
|
Outline of Annual Research Achievements |
本研究の目的は日本語の子音の音韻表示を音韻論(言語理論)、聴覚(認知?心理学)、自動音声認識(音声工学)の3つの側面から観察し、この3分野で共通して使用できる音韻表示モデルの構築である。研究プロジェクト2年目は、聴覚実験の実施、自動音声認識モデルの開発、人間と機械の音声認識比較を目標としており、この目標を計画通り達成し、人間と機械による音声認識を比較する新たな実験の枠組みを構築することができた。 聴覚実験課題には、日本語の歯擦音/s/と/sh/が語末に生起する場合の識別課題を被験者に出題した。語末の子音認識では、後続母音をヒントにすることができないため、文脈に依存しないGaussian Mixture Model(GMM)によるモデル化が適切だと考えられる。課題文にはGMMの学習データに『日本語話し言葉コーパス』から抽出した8万の歯擦音を使用した。人間の聴覚と機械の音声認識力の比較のために、/s/から/sh/に変わる連続体を合成して作成し、被験者に対して聴覚実験を行い、同じ刺激音を様々なパラメータで学習させたGMMモデルにも認識させた。人間と機械の類似性を測るために、/s/と/sh/の認識正答率の算出にくわえて、曖昧な子音も含めた連続体全体に対する認識プロファイルの相関性の比較方法も確立させた。この新しい比較方法は2015年9月の国際学会International Conference on Phonology and Phonetics (ICPP)でポスター発表した。さらに、聴覚実験の被験者を60人以上に増やし、様々な特徴ベクター(MFCC, PLP, 音声素性)や混合数を用いてGMMを学習させた。この分析結果まとめて2016年9月開催予定の国際学会InterSpeech 2016に投稿した。 本研究は、計画した3年目まで継続しなくても、人間と機械による音声認識を比較する新しい方法論を提供し、文系と理系を繋げるアプローチの実例として、学際成的な研究にも刺激になりうるようなものであった。
|