1990 Fiscal Year Annual Research Report
マルコフモデル・ニュ-ラルネットワ-クを包含する新しい音声認識手法の総合的研究
Project/Area Number |
01302032
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
中川 聖一 豊橋技術科学大学, 工学部, 教授 (20115893)
|
Co-Investigator(Kenkyū-buntansha) |
梅崎 太造 中部大学, 工学部, 講師 (40193932)
壇辻 正剛 関西大学, 文学部, 助教授 (10188469)
北沢 茂良 静岡大学, 工学部, 助教授 (00109018)
小林 豊 京都工芸織維大学, 工芸学部, 助手 (40027917)
新美 康永 京都工芸織維大学, 工芸学部, 教授 (00026030)
|
Keywords | 隠れマルコフモデル / ニュ-ラルネットワ-ク / 言語モデル / 音声認識 / 対話モデル / 認識単位 / 知覚モデル / 時系列パタ-ン |
Research Abstract |
本年度は2回の研究討論会と本総合研究会の内容と関連深い代表者が委員長を勤める電子情報通信学会の第2種研究会主催の2回のシンポジュウムを行なった。これらの参加者は総合研究の分担研究者ばかりでなく、数多くの関連研究者であり、実り多い議論ができた。これらの会合で話題になったのは(1)音声の認識単位,(2)音声認識の工学的または科学的アプロ-チの賛否,(3)ニュ-ラルネットワ-クと隠れマルコフモデルの総合・併合化,(4)統計的アプロ-チにおける汎化の問題等である。 主な成果をまとめれば、(1)音声認識の最適な単位は、学習用音声デ-タ量に依存し、より広範囲のコンテキストを考慮する必要があるがそのためには大規模な音声デ-タベ-スが必要である。この議論を踏まえて、日本音響学会に連続音声デ-タベ-ス検討会が発足した。(2)音声聴覚・知覚モデルに基づいた音声認識法は将来的には有望だが当分の間は純粋な工学的モデルの方がよい。(3)統計的アプロ-チでは認識対象の母集団からの学習デ-タを用いないと本質的に優れた識別関数は構成できない。(4)ニュ-ラルネットワ-クは静的パタ-ンの認識に,隠れマルコフモデルは時系列パタ-ンの処理に有効であり、両者の統合・結合が有望である。ニュ-ラルネットによる特微パラメ-タ時系列の非線形予測やデ-タ圧縮などが隠れマルコフモデルの前処理として有効である。 以上、本年度では音声デ-タベ-スの重要性と学習デ-タの母集団と評価用デ-タの母集団が異なる場合の認識システムの頑強性(ロハストネス)の考察の重要性、ニュ-ラルネットワ-クの長所と欠点が明らかになったことが成果である。
|
-
[Publications] 中川 聖一・村瀬 功: "連続音声認識システムの評価法ータスクの複雑性と文認識率との関係" 電子情報通信学会論文誌. 72DーII. 683-693 (1990)
-
[Publications] 中川 聖一・平田 好充・橋本 泰秀: "連続出力分布型HMMによる日本語音韻認識の検討" 日本音響学会誌. 46. 486-496 (1990)
-
[Publications] S.Nakagawa,Y.Ueda: "Automatic Extraction of Phonotactics based on Hidden Markov Models and Language Identification" Studia Phonologica. 24. (1991)
-
[Publications] S.Nakagawa,Y.Hashimoto: "Segmentation of Continuous Speech by HMM and Bayesian Probability," System and Computers in Japan. 21. 23-32 (1990)
-
[Publications] 中川 聖一: "音声認識、理解システムの評価とデ-タベ-ス" 電子情報通信学会誌. 73. 1304-1310 (1990)
-
[Publications] 中川 聖一・鹿野 清宏・東倉 洋一: "音声・聴覚と神経回路綱モデル" オ-ム社, 235 (1990)