研究概要 |
H15、16年度の研究を発展させるとともに、実環境での音声情報案内システム「たけまるくん」を運用し、音声データの収集およびデータベース化を進めた。教師なし話者適応の研究、ハンズフリー音声認識の研究を行った。非可聴つぶやき声(NAM : Non-Audible Murmur)による静かな音声メディアによる音声認識の研究も推進した。 (1)雑音に頑健な音声認識アルゴリズムとHMM(隠れマルコフモデル)十分統計量に基づく教師なし話者適応アルゴリズムの研究開発を次の事項について進めた。 (i)音声情報案内システム「たけまるくん」により,2年間分約30万発話の音声データの収集と書き起こしを終了した.このデータベースを利用して、新しい音韻モデルの構築アルゴリズムの研究を開始した。 (ii)HMM十分統計量に基づく教師なし話者適応アルゴリズムの高速化を達成し、数秒で適応できるオンラインシステムを構築した. (iii)音韻モデルの構築のゴストを減らすことを目指して、膨大な既存の音声データベースからタスクに適した音韻モデルを自動構築するアルゴリズムを考案し、その有効性を実証した. (iv)学研北生駒駅に音声情報案内システムを設置して運用を3月末に開始する予定である。並行して、ロボット対話システムも設置する予定であり、システム構築を行った。 (2)マイクロフォンアレーによる音声収録技術として、コンパクトかつ廉価なマイクロフォンアレーアルゴリズムの開発を行っている。空間スペクトル減算アレーSSA(Spatial Subtraction Array)の研究開発を進め、従来法より大幅に高い認識性能を達成した。 (i)空間スペクトル演算アレーSSA(Spatial Subtraction Array)の改良、音声認識性能評価・比較を,従来の遅延和型,Griffith-Jim適応型に対して行い,SSAの優位性を確認した. (ii)PCをベースで、ハンズフリー対話システムを構築して、実時間処理が可能であることを実証した. (3)つぶやき声(NAM : Non-Audible Murmur)は,話し手の近くでも聞こえない声である.NAMによる音声認識(無音声認識)の研究,および、声を出さない電話(無音声電話)の研究が進んだ.
|