2007 Fiscal Year Annual Research Report
Project/Area Number |
19700641
|
Research Institution | Kumamoto University |
Principal Investigator |
坂田 聡 Kumamoto University, 大学院・自然科学研究科, 助教 (80336205)
|
Keywords | 外国語発話訓練 / 画像化音声 / ニューラルネット / 音声学 / 可視化 |
Research Abstract |
本研究は,画像化音声を用いた外国語発話訓練システムの開発を目的とし,H19年度は以下の点に重点を置いて研究を行った。 (1)発話訓練システムのリアルタイム処理化の実現 (2)子音の音素特徴を抽出するニューラルネットの再構築 2.研究の遂行状況 (1)プログラミング言語Javaを用いて作成したこれまでのシステムは,0S非依存型のアプリケーションであったが、特に画像描画ルーチンにおいてリアルタイム処理が困難であった。訓練の性質上,訓練者の発話方法の変化を即座にフィードバックする事が重要であり,また,DSP等の特別な外部装置を必要とした場合,システム自体の普及を妨げると考え,今回,音声の入出力や画像表示をMicrosoft社が提供しているWIN32API関数を用い.Windowsアプリケーションの形式でシステムを再構築した。結果的に,マイクから入力した訓練者の音声格納,音素特徴の抽出,画像の生成までをリアルタイムで処理する事が可能となった。 (2)英語の音素的特徴に的を絞り,大語彙音声データベースを用いたニューラルネットの学習を行った。英語には,従来研究で対象としてきた日本語では用いない・はっきりと区別しない音素が多数存在するため,特に摩擦音と半母音を調音様式によって細かく分類し,その弁別性能の向上を図った。音声の時間的特徴を考慮し,Time-delayニューラルネットを採用し,付加するフレームについてネットワークごとに細かく検討したが,全体の識別精度はクローズドテストにおいても全フレームデータについて最大で60%程度であった事から,ニューラルネットに入力する音響パラメータについても再度検討する必要があると考えられる。
|