研究課題/領域番号 |
15K21232
|
研究機関 | 東京理科大学 |
研究代表者 |
黒田 佳織 東京理科大学, 工学部電気工学科, 助教 (70736397)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | マザリーズ / 音声認識 / HMM / DNN / 産後うつ |
研究実績の概要 |
本研究では,マザリーズ音声(対乳児音声)を定量的に評価する指標の開発,および,その提案指標を用いたマザリーズ音声と産後うつや生物学的因子との関連性について調査することを目的としている. これまで出力確率を混合ガウスモデルを用いて表した隠れマルコフモデル(HMM)により対乳児音声と対成人音声のモデルを作成していたが,本年度は,混合ガウスモデル(GMM)の代わりに,近年音声認識精度向上で注目されているディープニューラルネットワーク(DNN)を用いて音声モデルを作成することで,マザリーズ性評価指標の精度が向上するか検討した.しかし,DNNを用いた結果,従来の混合ガウスモデルを用いた場合よりも対乳児音声と対成人音声の識別精度が向上しない結果となった.この理由として,モデル作成の際に使用する学習データ数が足りなかったために対乳児音声と対成人音声の識別精度が向上しなかったと考えられる.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
今年度は,ディープニューラルネットワークを用いて対乳児音声モデルと対成人音声モデルを作成し,マザリーズ性評価指標の開発を進めたが,音声モデル作成のためには当初の予定よりも学習データ数を増やす必要があることがわかった.今後,学習データ数を増やし精度向上が見込めるか調査する必要がある.
|
今後の研究の推進方策 |
今後は,ディープニューラルネットワークを用いた音声モデルを作成するために,さらに学習データ数を増やす.また,現在は音声の特徴量として音韻的特徴のMel-Frequency Cepstral Coefficient(MFCC)のみ用いていたが,従来のマザリーズ研究で確認されてきたピッチや抑揚,話速などの韻律的特徴も組み合わせて用いることで,マザリーズ性評価指標のさらなる精度向上を目指す.さらに,開発した指標を用いてマザリーズ性を定量的に評価し,産後うつ病との関連性がないか調査する.
|
次年度使用額が生じた理由 |
本年度は,得られた研究成果を学術雑誌と国際会議へ投稿し研究発表を行う予定であったが,当初予定していた結果が得られなかったため,未使用額が生じた.
|
次年度使用額の使用計画 |
次年度は,研究成果発表を行うために,学術雑誌や国際会議等で発表するための投稿料,旅費などに使用する.
|