研究課題/領域番号 |
25330198
|
研究機関 | 九州工業大学 |
研究代表者 |
永井 秀利 九州工業大学, 大学院情報工学研究院, 助教 (60237485)
|
研究期間 (年度) |
2013-04-01 – 2017-03-31
|
キーワード | 黙声認識 / 無発声音声認識 / ウェーブレット解析 / ウェーブレット重心 / 重心推移法 / 表面筋電 |
研究実績の概要 |
本研究では自然な発声を対象にしているが,自然な発声の場合,発声に際して口唇形状が変化し続けてほとんど安定しないという問題がある.例えば2母音間においては,先行母音と後続母音との中間的な状態をゆるやかに経由するため,任意の区間を切り出して認識しようとするのは非現実的である.そこで本研究では,発声変化位置と口唇形状変化が極値を取った位置(口形極点)とを認識の基準となる位置としたが,本年度は特に口形極点の推定手法の改良を試みた.従来手法は表面筋電の周波数特徴量の一種であるウェーブレット重心のみに基づいて口唇形状変化を追跡していたが,ウェーブレット重心の大小と筋の発揮力の大小とは必ずしも一致していないため,口唇形状変化の追跡のためにかなり複雑な評価を行なっていた.この手法は,その複雑さ故に話者依存性の高さ等が危ぶまれたため,並行して研究を進めていた表面筋電信号の新たな分析手法に基づき,よりシンプルな手法を提案し,ほぼ同等の認識精度を得た. また,本年度は少数語彙世界での黙声認識に関する研究も行った.対象とした少数語彙世界は,被介護者が要望として発する1語文および2語文とした.単語数は15語で,文表現としては21種である.単語数認識の精度は95%程度であった.自然な発声を対象としているため,従来手法のように発声変化位置の同定を行うこととしたが,その場合,変化位置数が不明であることによる曖昧さが問題となる.そこで語彙数が限られていることを活かして,各語で検出されうる変化位置数の確率を推定するモデルを構築し,認識に組み入れた.認識実験における1位正解率は,1単語文の単語で89.4%,2単語文の先行語で51.0%,後続語で80.0%であった.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
自然な母音の発声の際に口唇形状が最も明確になった位置として推定する口形極点付近において,抽出する特徴量をいくつか変更して連続母音認識を試みてみたが,1位正解率にはあまり大きな違いは出なかった.それゆえ,口形極点位置の情報のみでの識別能力向上に力を注ぐことは得策ではないと判断することができ,従来研究の発声変化位置での特徴と合わせての認識へと進む際のベースラインとして設定できた. 今年度は少数語彙世界での実験を行えたことからも,研究はおおむね順調であると言える.少数語彙に絞ったにしては1位正解率は不満が残るものであったが,少数語彙であるからこそ適用可能な手法の開発を行うことができ,今後の改良のための課題も見えた.
|
今後の研究の推進方策 |
研究推進の基本方針を変更する必要はない.前年度の研究を下地として,これを発展させつつ,最終年度としてのまとめを行うことを目指す. これまでの研究では,自然な連続黙声における特徴抽出位置に関して大きく分けて2種類のアプローチを行い,加えて,チャネル毎の活動極大点の時間差などからも発声の特徴を抽出することを試みている.また,少数語彙世界であることを活用した認識手法の考え方を一般の認識に活用する手法の検討も行っている. これらの研究は,これまで個々に進めてきたとも言えるため,次年度は技術を統合しての認識の研究を進める予定である.
|