研究課題/領域番号 |
25330198
|
研究機関 | 九州工業大学 |
研究代表者 |
永井 秀利 九州工業大学, 大学院情報工学研究院, 助教 (60237485)
|
研究期間 (年度) |
2013-04-01 – 2017-03-31
|
キーワード | 黙声認識 / 無発声音声認識 / ウェーブレット解析 / 重心推移法 / 表面筋電 |
研究実績の概要 |
本研究の方針において極めて重要であるのが「自然な発声を対象にする」という点である.口唇形状を強調するような発声をすれば,見かけ上の精度向上は可能だが,そのような発声での長時間の会話は困難で,実用は難しい.自然な発声における問題は,発声に際して口唇形状が変化し続けることである.口唇形状変化は前後の発声音に依存するため,制約なしに連続発声中の一部時区間を切り出して認識しようとするのは非現実的である. そこで本研究では,連続黙声認識の実現に向けて,2種類のアプローチを取った.一つは,発声変化位置を同定し,その前後の特徴によって何から何へと発声が推移したかを認識しようとするものであり,もう一つは,口唇形状の変化を推測し,その変化が極値を取った時点が最も明瞭な特徴を有するとの考えに基づいて,その位置での特徴により認識しようとするものである. 前者の研究では,子音を含む連続黙声の発声に対して,我々が提案するウェーブレット係数の重心推移法に基づいた差分推移による変化位置検出手法を精緻化し,ア,カ,サ,マ,ワ,ンの内の2音の組み合わせ30種において,変化位置検出から隠れマルコフモデルに基づく認識までを行うことを試みた.5位正解率は9割以上を確保できたが,1位正解率は6割程度であり,まだ改良が必要である. 後者の研究では,重心推移法に基づいて口唇形状の縦幅と横幅の変化を追跡する手法を用い,極値を取った位置での特徴から連続2母音の認識を試みた.極値を取る位置であれば,少なくとも母音については前後の発声の影響を除外できるのではないかと考えたが,それに反して先行母音の影響可能性を加味する程に精度が向上する実験結果となり,口唇形状が明瞭な位置を選んだとしても先行音の影響は無視できないという重要な知見を得た.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
子音を含む連続黙声認識のためのモデル化を行い,限られた集合ではあるが,認識実験を行うことができた.その結果,現在の手法における課題のいくつかも得られており,その解消に向けての研究を進めている. また,自然な母音の発声において,口唇形状が最も明確になった位置での表面筋電に基づく場合であっても先行音の影響を無視できないということは,今後の特徴量化および認識の方針を左右する重要な知見であり,これが得られたことの意義は大きい.
|
今後の研究の推進方策 |
研究推進の基本方針を変更する必要はない.前年度の研究を下地として,これを発展させることを目指す. 今年度に試みた2種類のアプローチは組み合わせて用いることが可能であるため,今後はそれぞれのアプローチでの改良を進めると同時に,両者を一体化した認識を行うことも計画している. また,今年度の実験は2連続音に限られていたので,これを3音以上にも拡張して少数単語世界での認識に繋げるように研究を進める予定である.
|