Project/Area Number |
09750441
|
Research Category |
Grant-in-Aid for Encouragement of Young Scientists (A)
|
Allocation Type | Single-year Grants |
Research Field |
情報通信工学
|
Research Institution | Kushiro National College of Technology |
Principal Investigator |
大槻 典行 釧路工業高等専門学校, 情報工学科, 助教授 (30141857)
|
Project Period (FY) |
1997 – 1998
|
Project Status |
Completed (Fiscal Year 1998)
|
Budget Amount *help |
¥2,100,000 (Direct Cost: ¥2,100,000)
Fiscal Year 1998: ¥1,400,000 (Direct Cost: ¥1,400,000)
Fiscal Year 1997: ¥700,000 (Direct Cost: ¥700,000)
|
Keywords | ニューラルネットワーク / 音声認識 / 自己組織化 / 適応信号処理 / ニュートラルネットワーク |
Research Abstract |
本研究室で開発した新しい構造を持つニューラルネットワークを用いた音声認識における諸問題を検討した.前年度に検討した項目は“田本語全音素に対応すること"および“話者の依存性に関すること"の一部であった.本年度は,“話者の依存性に関すること"と“音声の経年変化について調査すること"について検討した.話者の依存性に関して,前年度2名の話者で行ってきた実験を合計6名の話者とし,その認識率を求めた.話者を増加した場合,本研究で用いている音声認識手法による認識実験では著しく認識率が低下した.この認識率の低下を改善するために次のことを行った.本音声認識手法の認識部にはニューラルネットワークを用いている.このニューラルネットワークは入力部に自己組織化層を持つ多層パーセプトロン型である.この入力部の自己組織化層に対して話者毎に学習を行い学習終了後この自己組織化層で生成されるクラスタを融合した.ニューラルネットワークの他の部分(層)については認識率が低下する前の状態と変えていない.この融合した自己組織化層を用いたニューラルネットワークによる音声認識実験の結果は,自己組織化層を融合する前に比較して6%の認識率の向上が見られた.自己組織化層の学習は1度だけ学習データをニューラルネットワークに与えるだけで良いので非常に短期間の学習で良く,この処理を加えることで話者の依存性を改善できたと言える. “音声の経年変化について調査すること"についてもこのニューラルネットワークの自己組織化層の学習のみで音声の経年変化に追従するという結果が得られている.しかし,常に学習状態にしておく必要は無く1ヶ月毎の学習で十分であると言う結果が得られている.この点については更に長い期間で検討する必要があると考えられる.
|